[分享发现] 分享一个企业内部小自动化:自动从邮箱收发票、解析附件、写入台账

最近做了一个比较小但实际价值挺高的企业内部自动化:自动从企业邮箱里收发票,解析附件,然后写入发票台账。

背景很简单。

很多公司的发票不是集中从一个系统出来,而是供应商、SaaS 平台、云服务商、各种服务商陆续发到邮箱里。

人工流程通常是:

搜索发票邮件 -> 点开邮件 -> 下载 PDF/OFD/XML/ZIP -> 识别金额和发票号 -> 录到表格 -> 附件归档 -> 季度报账时再打包。

真正麻烦的点有几个:

- 邮件模板不统一
- 附件格式不统一
- 有些发票在附件里,有些信息在正文里
- 有些只有下载链接
- 容易重复登记
- 后续查附件很痛苦

这次做法没有搞得很重。

大概架构:

- IMAP 拉取新增邮件
- 关键词和发件人规则筛选疑似发票邮件
- HTML 正文解析 + 主题解析
- XML/OFD/ZIP/PDF 附件解析
- PDF 文本提取失败时再用 AI 补字段
- 提取发票号、金额、日期、税额、购销方
- 按季度目录归档附件
- 写入在线表格台账
- 重复票据和无法识别邮件进入待确认队列

我觉得这个场景里比较重要的经验是:不要把所有事都交给 AI 。

规则适合做确定性判断:

- 是否重复
- 属于哪个季度
- 文件应该放哪里
- 什么情况下进入人工确认

AI 适合处理格式不稳定的内容:

- 邮件正文
- PDF 发票
- 平台模板变化
- 字段缺失补全

做完以后,解决的痛点主要不是“少录几个字段”,而是:

- 不用反复翻邮箱
- 不用人工整理附件目录
- 不用季度报账时到处找文件
- 不用担心同一张发票重复登记
- 无法识别的集中处理,责任边界清楚

这类小自动化在企业里其实很多,比如:

- 工资社保个税每月生成
- 季度报账资料打包
- 审批前发票金额核对
- 表格数据同步到另一个系统
- 邮件附件自动归档

我的感受是,企业内部自动化不一定从“做一个万能 Agent”开始。很多时候,先把一个高频、低风险、可回退的小流程做稳,ROI 反而更清楚。

如果你们公司也有这种靠人手工在邮箱、表格、网盘、审批系统之间搬数据的流程,可以交流下,我最近在专门整理这类场景。