功能Ask 智能问答
Ask 智能问答
基于知识库的对话式查询:用自然语言提问,直接得到引用源、可追溯的答案。
什么是 Ask
Ask 是 OctoReport 提供的智能问答功能,让你可以通过自然语言与系统交互,快速探索知识库内容或进行通用对话。
核心特点:
- 两种模式:知识库模式(Library Mode)+ 通用模式(General Mode)
- 流式响应:实时反馈,逐字显示,无需等待
- 推理过程:支持思维链(Chain-of-Thought)展示
- 快捷键:Cmd/Ctrl+K 快速唤起新对话
知识库模式(Library Mode)
什么是知识库模式
知识库模式基于 RAG(检索增强生成) 技术,让 AI 根据你的知识库内容回答问题,确保答案准确、有据可查。
工作原理:
你的提问
↓
关键词提取(LLM)
↓
检索相关内容(Top 10)
↓
构建上下文
↓
生成答案(带引用)
↓
流式输出如何使用
步骤 1: 选择知识库
- 点击顶部的 "知识库模式"
- 从下拉菜单选择目标知识库(例如:"AI行业新闻")
- 知识库必须包含内容才能使用
步骤 2: 提问
输入你的问题,例如:
- "最近有哪些关于 AI 的重要新闻?"
- "过去一周的科技热点是什么?"
- "总结一下 OpenAI 的最新动态"
步骤 3: 查看答案
AI 会:
- 从知识库中检索相关内容(最多 10 条)
- 基于内容生成回答
- 引用原始来源(标题 + URL)
- 逐字流式输出(实时反馈)
提示:知识库模式的答案基于你已收集的内容,如果知识库为空或内容不相关,AI 无法给出有效答案。
检索机制
关键词提取:
- AI 自动从你的问题中提取 3-5 个关键词
- 例如:"最近 AI 大模型的进展" →
["AI", "大模型", "进展"]
内容匹配:
- 在知识库中搜索包含关键词的内容
- 优先级:标题匹配 > 全文匹配
- 返回最相关的 Top 10 条内容
上下文构建:
[
{
"index": 1,
"title": "OpenAI 发布 GPT-4.5",
"source_url": "https://example.com/news/1",
"collected_at": "2025-01-15T08:00:00Z",
"content": "OpenAI 今天宣布..."
},
{
"index": 2,
"title": "谷歌推出 Gemini Ultra",
"source_url": "https://example.com/news/2",
"collected_at": "2025-01-14T10:30:00Z",
"content": "谷歌发布了..."
}
]AI 会基于这些内容生成回答,并在答案中引用原始来源。
最佳实践
适合的问题类型:
- 总结性问题:"过去一周有哪些重要新闻?"
- 对比性问题:"OpenAI 和 Google 的最新产品有什么区别?"
- 查找性问题:"有没有关于 AI 安全的内容?"
不适合的问题类型:
- 知识库外的问题:"今天天气怎么样?"(使用通用模式)
- 需要实时数据的问题:"现在股市行情如何?"(知识库内容有延迟)
- 需要计算的问题:"1+1 等于多少?"(使用通用模式)
成本说明
| 操作 | 成本 |
|---|---|
| 关键词提取 | 5-10 credits |
| 答案生成 | 10-50 credits(取决于模型和内容长度) |
| 总计 | 15-60 credits/次 |
通用模式(General Mode)
什么是通用模式
通用模式是标准的 AI 对话,不检索知识库,直接调用大语言模型回答问题。
适用场景:
- 通用知识问答:"什么是机器学习?"
- 代码帮助:"用 Python 写一个斐波那契数列"
- 创意写作:"帮我写一封邮件"
- 任何不需要知识库的对话
如何使用
- 点击顶部的 "通用模式"
- 直接输入你的问题
- AI 基于自身知识回答(不使用知识库)
提示:通用模式的答案基于 AI 的训练数据(截止日期见模型说明),不保证实时性。
成本说明
| 操作 | 成本 |
|---|---|
| 答案生成 | 10-50 credits(取决于模型和回答长度) |
通用模式比知识库模式便宜(无检索成本)。
流式响应
什么是流式响应
流式响应(Streaming)是指 AI 的回答逐字输出,类似打字效果,让你无需等待完整回答。
技术实现:
- 使用 Server-Sent Events (SSE) 协议
- 后端逐 token 推送,前端实时显示
- 支持中断(点击"停止生成"按钮)
用户体验:
- 实时反馈:看到第一个字只需 0.5-1 秒
- 可中断:如果答案不符合预期,随时停止
- 降低焦虑:不用盯着空白屏幕等待
推理过程展示
部分模型(如 OpenAI o1、DeepSeek-R1)支持 推理内容(Reasoning) 展示,即 AI 的"思考过程"。
示例:
【推理过程】
用户问了关于 AI 的问题,我需要:
1. 理解问题的核心
2. 从知识库中找到相关内容
3. 综合信息生成答案
【最终答案】
根据知识库内容,最近 AI 领域有以下重要进展...ℹ️ 说明:推理内容会折叠显示,点击"查看推理过程"展开。推理内容不计入答案长度,但会消耗额外 tokens。
会话管理
创建新会话
方式 1: 点击左上角 "新建对话" 按钮
方式 2: 使用快捷键 Cmd/Ctrl+K(快速唤起)
每个新会话都是独立的,不会继承历史对话的上下文。
查看历史会话
- 左侧边栏显示所有会话列表
- 每个会话显示:
- 第一条消息的标题(自动生成)
- 最后活动时间
- 消息数量
- 点击切换到该会话
删除会话
- 鼠标悬停在会话上
- 点击右侧的 "删除" 图标
- 确认删除(不可恢复)
⚠️ 警告:删除会话会同时删除该会话的所有消息,且无法恢复。
会话命名
会话标题基于第一条消息自动生成:
- 前 30 个字符作为标题
- 例如:"最近有哪些关于 AI 的重要新闻?" → "最近有哪些关于 AI 的重要新闻?"
目前不支持手动重命名会话(未来版本可能支持)。
键盘快捷键
| 快捷键 | 功能 |
|---|---|
Cmd/Ctrl + K | 新建对话 |
Enter | 发送消息 |
Shift + Enter | 换行(不发送) |
Esc | 停止生成 |
↑ | 编辑上一条消息(输入框为空时) |
常见问题
1. 知识库模式无法回答问题?
可能原因:
- 知识库为空或内容不相关
- 关键词提取不准确
- 检索到的内容质量差
解决方法:
- 确保知识库有相关内容
- 更精确地描述问题(包含关键词)
- 尝试使用通用模式
2. 答案不准确或有幻觉?
可能原因:
- 知识库模式:检索到的内容不相关或过时
- 通用模式:模型训练数据限制
解决方法:
- 知识库模式:检查知识库内容质量,更新数据源
- 通用模式:明确说明需要的答案类型
- 对于关键信息,人工验证答案的准确性
3. 消耗积分太快?
优化建议:
- 优先使用通用模式(无检索成本)
- 避免频繁提问相似问题
- 使用更便宜的模型(如 GPT-4o-mini)
- 精简问题,避免冗长的描述
4. 流式响应卡住?
可能原因:
- 网络不稳定
- 后端 LLM 服务超时
解决方法:
- 刷新页面重试
- 检查网络连接
- 联系管理员检查后端服务状态