ask_self

發表於 2024-12-29 更新於 2024-11-13 分類於文檔問答

ask_self

如果你不想使用文件檔案，希望直接輸入文件內容，你可以使用ask_self，使用 info 參數將文件的內容傳給語言模型，info參數可為str 或者 list of str。
若 info中的單一字串長度大於語言模型上限，該字串會被自行切割成 list of str，因此建議若文字過多，請自行分段成 list of str

若 info中的總文字內容過多，文件內容會被分別提供給語言模型作回答，並最終整合成一個最終回答，因此可能會花費較久時間。

example

install_requires = [
    "pypdf",
    "langchain>=0.1.0",
    "chromadb==0.4.14",
    "openai==0.27",
    "tiktoken",
    "lark==1.1.7",
    "scikit-learn<1.3.0",
    "jieba==0.42.1",
    "sentence-transformers==2.2.2",
    "torch==2.0.1",
    "transformers>=4.33.4", 
    "llama-cpp-python==0.2.6",
    "auto-gptq==0.3.1",
    "tqdm==4.65.0",
    "docx2txt==0.8",
    "rouge==1.0.1",
    "rouge-chinese==1.0.3",
    "bert-score==0.3.13",
    "click",
    "tokenizers>=0.13.3",
    "streamlit==1.28.2",
    "streamlit_option_menu==0.3.6",
]

ak = akasha.Doc_QA(
    verbose=True,
    max_input_tokens=30000,
    model="openai:gpt-4",
)
response = ak.ask_self(prompt="langchain的套件版本?", info=install_requires)

1	langchain的套件版本是0.1.0或更高版本。

self.docs的詳細資訊可參考文件搜尋

self.model_obj的詳細資訊可參考語言模型

0%