support Yi-Vl #23

Lzhang-hub · 2024-03-03T13:40:35Z

Is any plan support Yi-Vl?
https://huggingface.co/01-ai/Yi-VL-34B

ySingularity · 2024-03-08T07:16:07Z

It seems to have the same architecture as llava, you can try to load it by setting MODEL_TYPE=llava?

Lzhang-hub · 2024-03-14T02:03:46Z

I had test with MODEL_TYPE=llava, it can not work. Is it closed because it is already supported?

ySingularity · 2024-03-14T05:07:06Z

It is not supported specially yet, we will have a try and find the problem.
It would be appreciated if you could show us some error logs.

Lzhang-hub · 2024-03-14T07:15:08Z

this is error logs:

Traceback (most recent call last):
  File "/data1/nfs15/nfs/bigdata/zhanglei/conda/envs/rtp-llm-0227/lib/python3.10/runpy.py", line 196, in _run_module_as_main
    return _run_code(code, main_globals, None,
  File "/data1/nfs15/nfs/bigdata/zhanglei/conda/envs/rtp-llm-0227/lib/python3.10/runpy.py", line 86, in _run_code
    exec(code, run_globals)
  File "<maga_transformer-0.1.2+cuda121>/maga_transformer/start_server.py", line 388, in <module>
  File "<maga_transformer-0.1.2+cuda121>/maga_transformer/start_server.py", line 382, in main
  File "<maga_transformer-0.1.2+cuda121>/maga_transformer/start_server.py", line 350, in local_rank_main
  File "<maga_transformer-0.1.2+cuda121>/maga_transformer/start_server.py", line 347, in local_rank_main
  File "<maga_transformer-0.1.2+cuda121>/maga_transformer/start_server.py", line 67, in start
  File "<maga_transformer-0.1.4+cuda121>/maga_transformer/inference.py", line 28, in __init__
  File "<maga_transformer-0.1.4+cuda121>/maga_transformer/model_factory.py", line 172, in create_from_env
  File "<maga_transformer-0.1.4+cuda121>/maga_transformer/model_factory.py", line 70, in from_model_config
  File "<maga_transformer-0.1.4+cuda121>/maga_transformer/model_factory.py", line 49, in _create_model
  File "<maga_transformer-0.1.4+cuda121>/maga_transformer/models/gpt.py", line 173, in from_config
  File "<maga_transformer-0.1.4+cuda121>/maga_transformer/models/llava.py", line 82, in __init__
  File "<maga_transformer-0.1.4+cuda121>/maga_transformer/models/llava_vit.py", line 17, in __init__
  File "<maga_transformer-0.1.4+cuda121>/maga_transformer/models/llava_vit.py", line 161, in build_vision_projector
ValueError: Unknown projector type: mlp2x_gelu_Norm

yi-vl have little difference with lalva, We add LayNorm in the two-layer MLP of the projection module.
https://github.com/01-ai/Yi/tree/main/VL#major-difference-with-llava

I try resolve.

ySingularity · 2024-03-19T02:06:03Z

yi-vl have little difference with lalva, We add LayNorm in the two-layer MLP of the projection module.

Current implementation matches '^mlp(\d+)x_gelu$', and generates gelu and MLP. So that there should be a new branch to match the suffix '_Norm' and a norm layer attached.

dongjiyingdjy closed this as completed Mar 12, 2024

ySingularity reopened this Mar 14, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

support Yi-Vl #23

support Yi-Vl #23

Lzhang-hub commented Mar 3, 2024

ySingularity commented Mar 8, 2024

Lzhang-hub commented Mar 14, 2024

ySingularity commented Mar 14, 2024

Lzhang-hub commented Mar 14, 2024

ySingularity commented Mar 19, 2024

support Yi-Vl #23

support Yi-Vl #23

Comments

Lzhang-hub commented Mar 3, 2024

ySingularity commented Mar 8, 2024

Lzhang-hub commented Mar 14, 2024

ySingularity commented Mar 14, 2024

Lzhang-hub commented Mar 14, 2024

ySingularity commented Mar 19, 2024