如何最小代价构建各地 xx 的 xx 信息库。
Cursor 写爬虫抓取数据,有文字也有图片,不同数据源不同程序。图片可以用飞书多维表格中图片信息提取的能力。抓取的信息多,不方便用,所以还用了信息提取,提炼关键信息。保留原信息,必要的时候可以用
飞书多维表格结合字段捷径,用以修补数据。DeepSeek R1 抓取学校基本情况,特别要求从官方渠道获取
其他,因为飞书多维表的 DeepSeek R1 字段目前只能从一个原表字段获取,而且还不能是公式字段,有时候还需要增加 AI自定义自动填充字段
以及关联字段、查找字段,甚至还用飞书 AI 写公式(虽然是错的)等
飞书电子表格清洗数据
github 上找了省份城市区的标准编码
通过 api 将数据同步给业务系统