ask_self

ask_self

如果你不想使用文件檔案,希望直接輸入文件內容,你可以使用ask_self,使用 info 參數將文件的內容傳給語言模型,info參數可為str 或者 list of str
info中的單一字串長度大於語言模型上限,該字串會被自行切割成 list of str,因此建議若文字過多,請自行分段成 list of str

info中的總文字內容過多,文件內容會被分別提供給語言模型作回答,並最終整合成一個最終回答,因此可能會花費較久時間。

example

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
install_requires = [
"pypdf",
"langchain>=0.1.0",
"chromadb==0.4.14",
"openai==0.27",
"tiktoken",
"lark==1.1.7",
"scikit-learn<1.3.0",
"jieba==0.42.1",
"sentence-transformers==2.2.2",
"torch==2.0.1",
"transformers>=4.33.4",
"llama-cpp-python==0.2.6",
"auto-gptq==0.3.1",
"tqdm==4.65.0",
"docx2txt==0.8",
"rouge==1.0.1",
"rouge-chinese==1.0.3",
"bert-score==0.3.13",
"click",
"tokenizers>=0.13.3",
"streamlit==1.28.2",
"streamlit_option_menu==0.3.6",
]

ak = akasha.Doc_QA(
verbose=True,
max_input_tokens=30000,
model="openai:gpt-4",
)
response = ak.ask_self(prompt="langchain的套件版本?", info=install_requires)

1
langchain的套件版本是0.1.0或更高版本。
self.docs的詳細資訊可參考文件搜尋
self.model_obj的詳細資訊可參考語言模型