Ask 智能问答

基于知识库的对话式查询：用自然语言提问，直接得到引用源、可追溯的答案。

什么是 Ask

Ask 是 OctoReport 提供的智能问答功能，让你可以通过自然语言与系统交互，快速探索知识库内容或进行通用对话。

核心特点：

两种模式：知识库模式（Library Mode）+ 通用模式（General Mode）
流式响应：实时反馈，逐字显示，无需等待
推理过程：支持思维链（Chain-of-Thought）展示
快捷键：Cmd/Ctrl+K 快速唤起新对话

知识库模式（Library Mode）

什么是知识库模式

知识库模式基于 RAG（检索增强生成） 技术，让 AI 根据你的知识库内容回答问题，确保答案准确、有据可查。

工作原理：

你的提问
  ↓
关键词提取（LLM）
  ↓
检索相关内容（Top 10）
  ↓
构建上下文
  ↓
生成答案（带引用）
  ↓
流式输出

如何使用

步骤 1: 选择知识库

点击顶部的 "知识库模式"
从下拉菜单选择目标知识库（例如："AI行业新闻"）
知识库必须包含内容才能使用

步骤 2: 提问

输入你的问题，例如：

"最近有哪些关于 AI 的重要新闻？"
"过去一周的科技热点是什么？"
"总结一下 OpenAI 的最新动态"

步骤 3: 查看答案

AI 会：

从知识库中检索相关内容（最多 10 条）
基于内容生成回答
引用原始来源（标题 + URL）
逐字流式输出（实时反馈）

提示：知识库模式的答案基于你已收集的内容，如果知识库为空或内容不相关，AI 无法给出有效答案。

检索机制

关键词提取：

AI 自动从你的问题中提取 3-5 个关键词
例如："最近 AI 大模型的进展" → ["AI", "大模型", "进展"]

内容匹配：

在知识库中搜索包含关键词的内容
优先级：标题匹配 > 全文匹配
返回最相关的 Top 10 条内容

上下文构建：

[
  {
    "index": 1,
    "title": "OpenAI 发布 GPT-4.5",
    "source_url": "https://example.com/news/1",
    "collected_at": "2025-01-15T08:00:00Z",
    "content": "OpenAI 今天宣布..."
  },
  {
    "index": 2,
    "title": "谷歌推出 Gemini Ultra",
    "source_url": "https://example.com/news/2",
    "collected_at": "2025-01-14T10:30:00Z",
    "content": "谷歌发布了..."
  }
]

AI 会基于这些内容生成回答，并在答案中引用原始来源。

最佳实践

适合的问题类型：

总结性问题："过去一周有哪些重要新闻？"
对比性问题："OpenAI 和 Google 的最新产品有什么区别？"
查找性问题："有没有关于 AI 安全的内容？"

不适合的问题类型：

知识库外的问题："今天天气怎么样？"（使用通用模式）
需要实时数据的问题："现在股市行情如何？"（知识库内容有延迟）
需要计算的问题："1+1 等于多少？"（使用通用模式）

成本说明

操作	成本
关键词提取	5-10 credits
答案生成	10-50 credits（取决于模型和内容长度）
总计	15-60 credits/次

通用模式（General Mode）

什么是通用模式

通用模式是标准的 AI 对话，不检索知识库，直接调用大语言模型回答问题。

适用场景：

通用知识问答："什么是机器学习？"
代码帮助："用 Python 写一个斐波那契数列"
创意写作："帮我写一封邮件"
任何不需要知识库的对话

如何使用

点击顶部的 "通用模式"
直接输入你的问题
AI 基于自身知识回答（不使用知识库）

提示：通用模式的答案基于 AI 的训练数据（截止日期见模型说明），不保证实时性。

成本说明

操作	成本
答案生成	10-50 credits（取决于模型和回答长度）

通用模式比知识库模式便宜（无检索成本）。

流式响应

什么是流式响应

流式响应（Streaming）是指 AI 的回答逐字输出，类似打字效果，让你无需等待完整回答。

技术实现：

使用 Server-Sent Events (SSE) 协议
后端逐 token 推送，前端实时显示
支持中断（点击"停止生成"按钮）

用户体验：

实时反馈：看到第一个字只需 0.5-1 秒
可中断：如果答案不符合预期，随时停止
降低焦虑：不用盯着空白屏幕等待

推理过程展示

部分模型（如 OpenAI o1、DeepSeek-R1）支持 推理内容（Reasoning） 展示，即 AI 的"思考过程"。

示例：

【推理过程】
用户问了关于 AI 的问题，我需要：
1. 理解问题的核心
2. 从知识库中找到相关内容
3. 综合信息生成答案

【最终答案】
根据知识库内容，最近 AI 领域有以下重要进展...

ℹ️ 说明：推理内容会折叠显示，点击"查看推理过程"展开。推理内容不计入答案长度，但会消耗额外 tokens。

会话管理

创建新会话

方式 1: 点击左上角 "新建对话" 按钮

方式 2: 使用快捷键 Cmd/Ctrl+K（快速唤起）

每个新会话都是独立的，不会继承历史对话的上下文。

查看历史会话

左侧边栏显示所有会话列表
每个会话显示：
- 第一条消息的标题（自动生成）
- 最后活动时间
- 消息数量
点击切换到该会话

删除会话

鼠标悬停在会话上
点击右侧的 "删除" 图标
确认删除（不可恢复）

⚠️ 警告：删除会话会同时删除该会话的所有消息，且无法恢复。

会话命名

会话标题基于第一条消息自动生成：

前 30 个字符作为标题
例如："最近有哪些关于 AI 的重要新闻？" → "最近有哪些关于 AI 的重要新闻？"

目前不支持手动重命名会话（未来版本可能支持）。

键盘快捷键

快捷键	功能
`Cmd/Ctrl + K`	新建对话
`Enter`	发送消息
`Shift + Enter`	换行（不发送）
`Esc`	停止生成
`↑`	编辑上一条消息（输入框为空时）

常见问题

1. 知识库模式无法回答问题？

可能原因：

知识库为空或内容不相关
关键词提取不准确
检索到的内容质量差

解决方法：

确保知识库有相关内容
更精确地描述问题（包含关键词）
尝试使用通用模式

2. 答案不准确或有幻觉？

可能原因：

知识库模式：检索到的内容不相关或过时
通用模式：模型训练数据限制

解决方法：

知识库模式：检查知识库内容质量，更新数据源
通用模式：明确说明需要的答案类型
对于关键信息，人工验证答案的准确性

3. 消耗积分太快？

优化建议：

优先使用通用模式（无检索成本）
避免频繁提问相似问题
使用更便宜的模型（如 GPT-4o-mini）
精简问题，避免冗长的描述

4. 流式响应卡住？

可能原因：

网络不稳定
后端 LLM 服务超时

解决方法：

刷新页面重试
检查网络连接
联系管理员检查后端服务状态

下一步探索

报告生成 - 定时自动生成结构化报告
触发收件箱 - 通过邮件自然语言触发报告
积分与日志 - 查看消费明细和任务日志

什么是 Ask

Ask 是 OctoReport 提供的智能问答功能，让你可以通过自然语言与系统交互，快速探索知识库内容或进行通用对话。

核心特点：

两种模式：知识库模式（Library Mode）+ 通用模式（General Mode）
流式响应：实时反馈，逐字显示，无需等待
推理过程：支持思维链（Chain-of-Thought）展示
快捷键：Cmd/Ctrl+K 快速唤起新对话

知识库模式（Library Mode）

什么是知识库模式

知识库模式基于 RAG（检索增强生成） 技术，让 AI 根据你的知识库内容回答问题，确保答案准确、有据可查。

工作原理：

你的提问
  ↓
关键词提取（LLM）
  ↓
检索相关内容（Top 10）
  ↓
构建上下文
  ↓
生成答案（带引用）
  ↓
流式输出

如何使用

步骤 1: 选择知识库

点击顶部的 "知识库模式"
从下拉菜单选择目标知识库（例如："AI行业新闻"）
知识库必须包含内容才能使用

步骤 2: 提问

输入你的问题，例如：

"最近有哪些关于 AI 的重要新闻？"
"过去一周的科技热点是什么？"
"总结一下 OpenAI 的最新动态"

步骤 3: 查看答案

AI 会：

从知识库中检索相关内容（最多 10 条）
基于内容生成回答
引用原始来源（标题 + URL）
逐字流式输出（实时反馈）

提示：知识库模式的答案基于你已收集的内容，如果知识库为空或内容不相关，AI 无法给出有效答案。

检索机制

关键词提取：

AI 自动从你的问题中提取 3-5 个关键词
例如："最近 AI 大模型的进展" → ["AI", "大模型", "进展"]

内容匹配：

在知识库中搜索包含关键词的内容
优先级：标题匹配 > 全文匹配
返回最相关的 Top 10 条内容

上下文构建：

[
  {
    "index": 1,
    "title": "OpenAI 发布 GPT-4.5",
    "source_url": "https://example.com/news/1",
    "collected_at": "2025-01-15T08:00:00Z",
    "content": "OpenAI 今天宣布..."
  },
  {
    "index": 2,
    "title": "谷歌推出 Gemini Ultra",
    "source_url": "https://example.com/news/2",
    "collected_at": "2025-01-14T10:30:00Z",
    "content": "谷歌发布了..."
  }
]

AI 会基于这些内容生成回答，并在答案中引用原始来源。

最佳实践

适合的问题类型：

总结性问题："过去一周有哪些重要新闻？"
对比性问题："OpenAI 和 Google 的最新产品有什么区别？"
查找性问题："有没有关于 AI 安全的内容？"

不适合的问题类型：

知识库外的问题："今天天气怎么样？"（使用通用模式）
需要实时数据的问题："现在股市行情如何？"（知识库内容有延迟）
需要计算的问题："1+1 等于多少？"（使用通用模式）

成本说明

操作	成本
关键词提取	5-10 credits
答案生成	10-50 credits（取决于模型和内容长度）
总计	15-60 credits/次

通用模式（General Mode）

什么是通用模式

通用模式是标准的 AI 对话，不检索知识库，直接调用大语言模型回答问题。

适用场景：

通用知识问答："什么是机器学习？"
代码帮助："用 Python 写一个斐波那契数列"
创意写作："帮我写一封邮件"
任何不需要知识库的对话

如何使用

点击顶部的 "通用模式"
直接输入你的问题
AI 基于自身知识回答（不使用知识库）

提示：通用模式的答案基于 AI 的训练数据（截止日期见模型说明），不保证实时性。

成本说明

操作	成本
答案生成	10-50 credits（取决于模型和回答长度）

通用模式比知识库模式便宜（无检索成本）。

流式响应

什么是流式响应

流式响应（Streaming）是指 AI 的回答逐字输出，类似打字效果，让你无需等待完整回答。

技术实现：

使用 Server-Sent Events (SSE) 协议
后端逐 token 推送，前端实时显示
支持中断（点击"停止生成"按钮）

用户体验：

实时反馈：看到第一个字只需 0.5-1 秒
可中断：如果答案不符合预期，随时停止
降低焦虑：不用盯着空白屏幕等待

推理过程展示

部分模型（如 OpenAI o1、DeepSeek-R1）支持 推理内容（Reasoning） 展示，即 AI 的"思考过程"。

示例：

【推理过程】
用户问了关于 AI 的问题，我需要：
1. 理解问题的核心
2. 从知识库中找到相关内容
3. 综合信息生成答案

【最终答案】
根据知识库内容，最近 AI 领域有以下重要进展...

ℹ️ 说明：推理内容会折叠显示，点击"查看推理过程"展开。推理内容不计入答案长度，但会消耗额外 tokens。

会话管理

创建新会话

方式 1: 点击左上角 "新建对话" 按钮

方式 2: 使用快捷键 Cmd/Ctrl+K（快速唤起）

每个新会话都是独立的，不会继承历史对话的上下文。

查看历史会话

左侧边栏显示所有会话列表
每个会话显示：
- 第一条消息的标题（自动生成）
- 最后活动时间
- 消息数量
点击切换到该会话

删除会话

鼠标悬停在会话上
点击右侧的 "删除" 图标
确认删除（不可恢复）

⚠️ 警告：删除会话会同时删除该会话的所有消息，且无法恢复。

会话命名

会话标题基于第一条消息自动生成：

前 30 个字符作为标题
例如："最近有哪些关于 AI 的重要新闻？" → "最近有哪些关于 AI 的重要新闻？"

目前不支持手动重命名会话（未来版本可能支持）。

键盘快捷键

快捷键	功能
`Cmd/Ctrl + K`	新建对话
`Enter`	发送消息
`Shift + Enter`	换行（不发送）
`Esc`	停止生成
`↑`	编辑上一条消息（输入框为空时）

常见问题

1. 知识库模式无法回答问题？

可能原因：

知识库为空或内容不相关
关键词提取不准确
检索到的内容质量差

解决方法：

确保知识库有相关内容
更精确地描述问题（包含关键词）
尝试使用通用模式

2. 答案不准确或有幻觉？

可能原因：

知识库模式：检索到的内容不相关或过时
通用模式：模型训练数据限制

解决方法：

知识库模式：检查知识库内容质量，更新数据源
通用模式：明确说明需要的答案类型
对于关键信息，人工验证答案的准确性

3. 消耗积分太快？

优化建议：

优先使用通用模式（无检索成本）
避免频繁提问相似问题
使用更便宜的模型（如 GPT-4o-mini）
精简问题，避免冗长的描述

4. 流式响应卡住？

可能原因：

网络不稳定
后端 LLM 服务超时

解决方法：

刷新页面重试
检查网络连接
联系管理员检查后端服务状态

下一步探索

报告生成 - 定时自动生成结构化报告
触发收件箱 - 通过邮件自然语言触发报告
积分与日志 - 查看消费明细和任务日志

On this page

Ask 智能问答

On this page