add vLLM surpport for gradio demo, inference script and openai api demo #35

GoGoJoestar · 2023-08-01T08:10:51Z

Description

This PR add support for gradio demo (gradio_demo.py), inference script (inference_hf.py) and openai api demo (add 3 new file in directionary openai_server_demo)

Related Issue

None.

airaria · 2023-08-01T09:00:45Z

Why we need openai_server_demo/README_vllm.md?
Can we just use one README file?

GoGoJoestar · 2023-08-01T09:14:15Z

Some contents in openai_server_demo/README_vllm.md and openai_server_demo/README.md are similar or even same, but some are different, it's hard to merge. If add README_vllm.md to the end of README.md, the doc is too long. So, I create a new README file.

airaria · 2023-08-01T10:02:26Z

scripts/inference/inference_hf.py

+        model_vocab_size = base_model.get_input_embeddings().weight.size(0)
+        tokenzier_vocab_size = len(tokenizer)
+        print(f"Vocab of the base model: {model_vocab_size}")
+        print(f"Vocab of the tokenizer: {tokenzier_vocab_size}")
+        if model_vocab_size!=tokenzier_vocab_size:
+            print("Resize model embeddings to fit tokenizer")
+            base_model.resize_token_embeddings(tokenzier_vocab_size)


tokenzier->tokenizer

GoGoJoestar and others added 6 commits August 1, 2023 15:34

add vLLM support

150e751

Merge branch 'ymcui:main' into main

6a53e77

merge

4702b33

fix bug in scripts/openai_server_demo/README_vllm.md

745d151

fix bugs

afac923

change subprocess call without shell=True

26c3fff

change subprocess.call to subprocess.check_call

8bd79a3

GoGoJoestar added 2 commits August 1, 2023 17:22

fix spelling error: tokenzier_vocab_size -> tokenizer_vocab_size

a006811

modify README

fb75a74

airaria reviewed Aug 1, 2023

View reviewed changes

fix spelling error

ae9f623

airaria approved these changes Aug 2, 2023

View reviewed changes

ymcui merged commit 7b0c3b7 into ymcui:main Aug 2, 2023
1 check passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

add vLLM surpport for gradio demo, inference script and openai api demo #35

add vLLM surpport for gradio demo, inference script and openai api demo #35

GoGoJoestar commented Aug 1, 2023

airaria commented Aug 1, 2023

GoGoJoestar commented Aug 1, 2023

airaria Aug 1, 2023

add vLLM surpport for gradio demo, inference script and openai api demo #35

add vLLM surpport for gradio demo, inference script and openai api demo #35

Conversation

GoGoJoestar commented Aug 1, 2023

Description

Related Issue

airaria commented Aug 1, 2023

GoGoJoestar commented Aug 1, 2023

airaria Aug 1, 2023

Choose a reason for hiding this comment