GitHub - jaiminjariwala/Multimodal-Content-Generation-using-LLMs: Multimodal Content Generation that includes Conversational chatbot, Image Summarizer and Text-to-Image Capabilities.

title	emoji	colorFrom	colorTo	sdk	sdk_version	app_file	pinned	license
Multimodal Content Generation	🤗	indigo	green	streamlit	1.32.0	multi-modal-content-generation.py	false	apache-2.0

A Multimodal Content Generation have following capabilities:

1. A `Conversational chatbot` as same as `ChatGPT v3.5 + Image Summarization` Capabilities through `GOOGLE GEMINI VISION PRO API`.

Screen.Recording.2024-03-07.at.4.37.26.PM.mov

2. `Text to Image` (using Stability Ai (Stable Diffusion)) through `REPLICATE API`.

Setup steps:

Create virtual environment

python -m venv <name of virtual environment>

Activate it

source <name of virtual environment>/bin/activate

Now install required libraries from requirements.txt file using...
```
pip install -r requirements.txt
```

Create .env file and add your API TOKEN

GOOGLE_API_KEY="Enter Your GOOGLE API TOKEN"
REPLICATE_API_KEY=""

To run app
```
streamlit run <name-of-app>.py
```

Also Deployed on Render (but due to inactivity, it may take around 50 seconds to load the site): https://multimodal-content-generation-using-llms.onrender.com/

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
.github/workflows		.github/workflows
README.md		README.md
multi-modal-content-generation.py		multi-modal-content-generation.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

.github/workflows

.github/workflows

README.md

README.md

multi-modal-content-generation.py

multi-modal-content-generation.py

requirements.txt

requirements.txt

Repository files navigation

A Multimodal Content Generation have following capabilities:

1. A `Conversational chatbot` as same as `ChatGPT v3.5 + Image Summarization` Capabilities through `GOOGLE GEMINI VISION PRO API`.

2. `Text to Image` (using Stability Ai (Stable Diffusion)) through `REPLICATE API`.

Setup steps:

Also Deployed on Render (but due to inactivity, it may take around 50 seconds to load the site): https://multimodal-content-generation-using-llms.onrender.com/

About

Releases

Packages

Languages

jaiminjariwala/Multimodal-Content-Generation-using-LLMs

Folders and files

Latest commit

History

Repository files navigation

A Multimodal Content Generation have following capabilities:

1. A Conversational chatbot as same as ChatGPT v3.5 + Image Summarization Capabilities through GOOGLE GEMINI VISION PRO API.

2. Text to Image (using Stability Ai (Stable Diffusion)) through REPLICATE API.

Setup steps:

Also Deployed on Render (but due to inactivity, it may take around 50 seconds to load the site): https://multimodal-content-generation-using-llms.onrender.com/

About

Topics

Resources

Stars

Watchers

Forks

Languages

1. A `Conversational chatbot` as same as `ChatGPT v3.5 + Image Summarization` Capabilities through `GOOGLE GEMINI VISION PRO API`.

2. `Text to Image` (using Stability Ai (Stable Diffusion)) through `REPLICATE API`.