openclaw cron edit 363c249e-3a43-4028-b61d-c266e37e8e76 --message "TENCENT_NEWS_APIKEY=eyJhbGci...; ~/.openclaw/workspace/skills/tencent-news/tencent-news-cli ai-daily"📰 AI Daily · YYYY-MM-DDJgFWfHjlUlUiXDdn8uRckcJ5nsf/tmp/sehk26040104032_c.pdf(香港联交所申请版本,共364页)| 维度 | 关键数据 |
|---|---|
| AI收入占比 | 2023年43.2% → 2024年55.9% → 2025年64.5% |
| 2025年AI收入 | 20.3亿元(同比+56.8%) |
| 在手订单 | 51亿元(2025年底),同比+111%,连续9个季度高位 |
| 新签合同 | 2025年60亿元,同比翻倍(+103.4%) |
| AI算力相关订单占比 | 超73% |
| 数据处理终端在手订单占比 | 近60% |
pip3 install pdfplumber --break-system-packagespython3 -c "import pdfplumber; pdf = pdfplumber.open('path'); [print(f'=== PAGE {i+1} ===\\n', p.extract_text()[:3000]) for i, p in enumerate(pdf.pages) if condition]"---
# 🦞 进化日报 · 2026-04-02(周四)
---
完成对芯原微电子(688521.SH)港股上市申请版本(364页PDF)的系统性AI数据挖掘与分析。
最关键发现(招股书原文):
文档成果:
---
发生了什么:早上第一次扫描时,只扫了第75-130页的部分段落,漏掉了第112-145页大量AI业务详细信息(VPU、NPU、AI眼镜、AI玩具、RISC-V生态等关键数据)。
为什么犯错:用"第75-130页范围内AI相关内容"作为筛选条件,但这个范围并不准确——真正的AI业务主场在第112-145页。
正确做法:先用宽泛关键词('AI' in text)扫描全量PDF,标记所有含AI的页面,再针对具体段落精读。不要预设"AI内容在这个范围"。
这次怎么发现的:大王问"还有没有AI相关数据",我重新全量扫描才发现遗漏。
记住:
---
发生了什么:两次对投研文档用 feishu_update_doc(doc_id, mode="overwrite") 更新,导致前8章内容被覆盖,只剩下AI深度解析部分。
为什么犯错:overwrite 模式是整体替换,不是追加。我在第一次更新AI解析时就用了overwrite,之后又重复使用,覆盖了原有的前8章。
正确做法:
append 模式replace_all 或 insert_after 模式精确定位overwrite,且重建前必须确认内容已备份这次怎么发现的:大王说"前面1-8章怎么删掉了",我立刻发现。
记住:
overwrite = 全量替换,极高风险append 模式---
2. feishu_update_doc 模式选择:append / insert_after / replace_all 三种模式要分清楚再用
3. 招股书结构:香港上市申请版本约360页,内容组织顺序通常是:概要→风险→行业→业务→财务→附注,AI相关内容分散在业务章(第112-145页)和概要/财务章(第4-9页)
---