OctoReport
OctoReport
HomeConsole文档
产品概述快速上手

内容采集

数据源管理 - 总览搜索类源RSS 订阅源网页与邮件源政府与新闻源

内容库与报告

知识库管理报告生成

投递与对话

触发收件箱(邮件通道)Ask 智能问答

运营

积分与日志
原子计费机制URL 去重技术系统可靠性
配置技巧优化与排查
OctoReport 常见问题与支持
功能内容源政府与新闻源

政府与新闻源

了解招标公告源和 Google News 的功能和配置方法

概述

政府与新闻源提供两种专门化的数据源类型,帮助你监控政府采购信息和全球新闻动态:

  1. 招标公告源(Tender) - 监控中国政府采购平台的招标信息
  2. Google News - 监控全球新闻,支持 8 种语言和 8 个地区

招标公告源(Tender)

功能介绍

监控中国政府采购网(CCGP)及地方平台的招标公告,适合企业监控商机。

核心功能:

  • 关键词搜索(多个关键词用逗号分隔)
  • 自动去重(KEEP_OLD 策略)
  • 结构化提取(标题、金额、截止时间、联系方式)
  • 定时监控(推荐每天 1 次)

配置参数

参数类型必填说明
keywordsString✅关键词,多个用逗号分隔(如 "IT咨询,软件开发")
scheduleString✅定时策略(推荐每天 1 次)
deduplicationString-去重策略(默认 KEEP_OLD,节省成本)
needCleaningBoolean-是否使用 LLM 清洗内容(推荐开启)
libraryIdsArray✅关联的知识库 ID

配置示例

{
  "name": "IT咨询招标监控",
  "type": "tender",
  "config": {
    "keywords": "IT咨询,信息系统,软件开发,数字化转型",
    "schedule": {
      "days": [1, 2, 3, 4, 5],
      "hour": 9,
      "minute": 0
    }
  },
  "deduplication": "KEEP_OLD",
  "needCleaning": true,
  "libraryIds": [1]
}

说明:

  • 关键词:监控 IT 咨询相关的招标信息
  • 定时:工作日每天早上 9:00 执行
  • 去重:KEEP_OLD 策略,避免重复抓取(节省成本)
  • 清洗:开启 LLM 清洗,提取金额、截止时间等关键信息

最佳实践

关键词选择:

  • ✅ 使用行业通用术语(如 "IT咨询"、"软件开发")
  • ✅ 包含多个相关关键词(提高覆盖率)
  • ❌ 避免过于宽泛的关键词(如 "服务"、"采购")

定时策略:

  • 推荐:工作日每天 1 次(成本低,覆盖全)
  • 高频监控:每天 2-3 次(适合竞争激烈的行业)

成本优化:

  • 使用 KEEP_OLD 去重策略(避免重复抓取)
  • 开启内容清洗(提取结构化数据)

Google News

功能介绍

提供全球新闻监控,支持 8 种语言 和 8 个地区,适合国际化新闻聚合。

特点:多语言支持、多地区覆盖、关键词搜索、RSS 订阅式更新(低成本)

语言和地区支持

支持的语言(8种)

语言代码适用场景
英语en全球主流新闻
中文(简体)zh-cn中国大陆新闻
中文(繁体)zh-tw台湾、香港新闻
日语ja日本新闻
韩语ko韩国新闻
法语fr法国、欧洲新闻
德语de德国、欧洲新闻
西班牙语es西班牙、拉美新闻

支持的地区(8个)

地区代码说明
美国US美国本土新闻
中国CN中国本土新闻
日本JP日本本土新闻
韩国KR韩国本土新闻
英国GB英国本土新闻
法国FR法国本土新闻
德国DE德国本土新闻
澳大利亚AU澳大利亚本土新闻

组合示例:

  • zh-cn + CN = 中文简体 + 中国新闻
  • en + US = 英文 + 美国新闻
  • ja + JP = 日语 + 日本新闻

配置参数

参数类型必填说明
keywordsString✅关键词(支持中英文等多种语言)
languageString✅语言代码(如 zh-cn、en)
regionString✅地区代码(如 CN、US)
scheduleString✅定时策略(推荐每 2-6 小时)
deduplicationString-去重策略(默认 KEEP_OLD)
libraryIdsArray✅关联的知识库 ID

配置示例

示例 1:中文科技新闻(中国)

{
  "name": "中文科技新闻",
  "type": "google-news",
  "config": {
    "keywords": "人工智能,AI,机器学习,深度学习",
    "language": "zh-cn",
    "region": "CN",
    "schedule": {
      "hours": 6
    }
  },
  "deduplication": "KEEP_OLD",
  "libraryIds": [1]
}

示例 2:英文金融新闻(美国)

{
  "name": "US Finance News",
  "type": "google-news",
  "config": {
    "keywords": "stock market,Federal Reserve,inflation,economy",
    "language": "en",
    "region": "US",
    "schedule": {
      "hours": 4
    }
  },
  "deduplication": "KEEP_OLD",
  "libraryIds": [2]
}

示例 3:日语科技新闻(日本)

{
  "name": "日本科技ニュース",
  "type": "google-news",
  "config": {
    "keywords": "テクノロジー,AI,スタートアップ",
    "language": "ja",
    "region": "JP",
    "schedule": {
      "hours": 6
    }
  },
  "deduplication": "KEEP_OLD",
  "libraryIds": [3]
}

最佳实践

✅ 招标监控场景

监控 IT 咨询相关的政府采购信息:招标公告源 + 关键词 "IT咨询,软件开发" + 工作日每天 9:00 + KEEP_OLD + 开启清洗

✅ 国际新闻监控场景

监控全球 AI 新闻(中英日三语):创建 3 个 Google News 数据源(中文+CN、英文+US、日语+JP)+ 对应关键词 + 每 6 小时 + KEEP_OLD

✅ 成本优化技巧

  • 招标公告源:KEEP_OLD + 工作日每天 1 次 + 精准关键词
  • Google News:KEEP_OLD + 每 6 小时 + 关闭清洗

常见问题

Q1: 招标公告源能监控哪些平台?

A: 目前支持中国政府采购网(CCGP)及主要地方政府采购平台。如需监控特定平台,请联系支持团队。

Q2: Google News 支持更多语言吗?

A: 目前支持 8 种主流语言(英、中简、中繁、日、韩、法、德、西)。如需其他语言支持,请提交功能请求。

Q3: 如何选择合适的定时策略?

A:

  • 招标公告:工作日每天 1 次(成本低,覆盖全)
  • Google News:每 2-6 小时(新闻更新频率适中)
  • 紧急监控:可临时调整为每小时

Q4: 为什么推荐使用 KEEP_OLD 去重策略?

A:

  • 招标公告:内容发布后不会更新,KEEP_OLD 避免重复抓取,节省成本
  • Google News:RSS 内容不会更新,KEEP_OLD 策略最省钱

下一步

  • 知识库管理 - 管理收集的内容
  • 报告生成 - 基于内容生成报告
  • 配置技巧 - 最佳实践和优化建议

网页与邮件源

网页抓取与邮件监控:适用于无 RSS 订阅的网站、邮件通知场景以及邮件列表新闻源。

知识库管理

了解如何创建知识库、组织数据源、管理内容标签,让多源信息变成可检索可分析的知识资产。

On this page

概述招标公告源(Tender)功能介绍配置参数配置示例最佳实践Google News功能介绍语言和地区支持支持的语言(8种)支持的地区(8个)配置参数配置示例示例 1:中文科技新闻(中国)示例 2:英文金融新闻(美国)示例 3:日语科技新闻(日本)最佳实践✅ 招标监控场景✅ 国际新闻监控场景✅ 成本优化技巧常见问题Q1: 招标公告源能监控哪些平台?Q2: Google News 支持更多语言吗?Q3: 如何选择合适的定时策略?Q4: 为什么推荐使用 KEEP_OLD 去重策略?下一步