viddesc

Real-time video description chatbot for visual and cognitive assistance.

Description

Uses a PyTorch video description model trained on COCO, YouTube8M, and MPII Movie Description datasets. The video description model is based on the pytorch advanced tutorial on image description. Uses [nlpi](http://github.com/totalgood/nlpia) for dialog management.

References

<a href="https://arxiv.org/pdf/1611.07810.pdf">"A dataset and exploration of models for understanding video data through fill-in-the-blank question-answering"</a> by Maharaj et al at <a href="mpi-inf.mpg.de">MPII</a>.
<a href="https://arxiv.org/pdf/1502.08029.pdf">"Describing Videos by Exploting Temporal Structure"</a> by Yao et al at the University of Montreal.

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
conda		conda
docs		docs
requirements		requirements
scripts		scripts
src		src
tests		tests
.DS_Store		.DS_Store
.coveragerc		.coveragerc
.gitignore		.gitignore
.travis.yml		.travis.yml
AUTHORS.rst		AUTHORS.rst
CHANGELOG.rst		CHANGELOG.rst
LICENSE.txt		LICENSE.txt
README.rst		README.rst
requirements.txt		requirements.txt
setup.cfg		setup.cfg
setup.py		setup.py

License

totalgood/viddesc

Folders and files

Latest commit

History

Repository files navigation

viddesc

Description

References

About

Resources

License

Stars

Watchers

Forks

Languages