闲来无事

老是碰到大量重复性的工作,想着让ai写个工具能够简化一下我的操作,并且也结合了以前写的一些工具,集成了一下
项目地址

数据处理

字段提取

测试文件如下

选择文件后,会识别分隔符,如果识别不到可以手动设置,然后自动读取表头信息

比如提取url和公司

文件如下

数据填充

这个功能就是服务于前面的,提取后的数据填充到对应的模板上面
源文件就是提取后的数据文件,然后再选个模板文件
比如模板文件是这样

选好文件后,然后要选择映射

然后点启用映射就行,映射情况如下

开始填充

填充好之后

模板管理

这个就是之前数据填充那边,将映射关系保存为模板之后查看的地方
界面如下

模板信息

信息收集

企业查询

天眼查

抓个cookie,记得得网页先查一下,身份验证通过以后就行了

批量最多能查多少还不知道,最多的的是,一次性查了77家,然后没被ban

爱企查

抓个cookie直接查,而且cookie可用时间很久啊,半个多月了,具体忘了,反正挺久
能查地址、注册号、备案号、资产主域名、员工联系方式(不保真,就是爱企查那边更多手机号的信息)

资产测绘

fofa(图一乐,api不能免费用先写着,以后要花钱了再完善)

就是根据fofa的api文档写的

然后测试请求和响应

现在貌似是更新了,我记得以前好像有直接给python的实例代码
影响不大,根据这个curl命令的请求用request模块也能直接写了,这里主要是看响应的内容,毕竟要做一下数据格式化
然后界面是这个效果

hunter

同样也是根据api文档写,思路和fofa那边一样
界面这样

查询之后的数据显示

然后导出,有以下几种格式可选

比如导出成txt,格式如下

感觉有点乱,但实际都是很列分好的,可以用之前数据处理那边的提取功能,把想要的字段提取出来,合成一个新文件用

360quake

他的界面以及查询后的数据显示是

本来我看就是网页版查是有显示备案号和备案主体这两列的,但是我用api查一直不显示,我以为是代码问题,后来就是用curl命令测试了一下,发现这两个字段返回的是空值,并且网页上,这两列也置空,多此一举了属于是

语法文档和统一查询

设置了语法文档和统一查询功能,语法文档我是直接把api文档喂给ai写的,所以有点不全但是日常基本使用还是能直接查的




统一查询界面是这样

写了个简单的语句转换逻辑,可以一次查询调用三个平台(理论上,实际实验测试都是用hunter和360quake)



导出后自带去重,哦好像去重逻辑没怎么写好,多了比较多无意义的行

威胁情报

根据微步的api写的,但是比较鸡肋,md基本有用的功能都不让你免费用

ip信誉

查询完的界面如下

最后面这个查看详情按钮点击后可以跳到IP对应的情报查询结果页链接

域名失陷检测

查询结果如下

文件分析

哈希查询

界面如下

查询结果

可以直接看详情或者打开报告


还有单纯的多引擎检测

文件上传

界面如下

查询结果

打开报告

详情

江湖救急

周报生成

界面长这样

运行结果

大致原理:
最初想法是,win+tab快捷键能看到打开的历史文件数据,他的数据来源是Windows活动历史数据库,然后就会遇到一些问题 :

  • SQLite数据库结构复杂 :微软没有公开完整的数据库架构文档
  • 表结构经常变化 :Windows更新时数据库结构可能改变
  • 数据关联复杂 :需要关联多个表才能获取完整信息
  • 二进制数据 :部分字段存储为二进制格式,需要特殊解析
  • API限制
    Microsoft Graph API :
    • 需要Azure AD应用注册
    • 需要企业级权限
    • 个人用户难以获取必要的API密钥
    • 有严格的调用频率限制
      Windows Runtime API :
    • 主要面向UWP应用
    • Python调用复杂,需要额外的COM组件
    • 功能有限,无法获取详细的文件信息
      那就替换方案,改成读取注册表 + 最近文件夹 + 文件系统,这样好操作

文档处理

网信办通报改写

进行区网信办的通报文件改写
唉,驻场的本职工作,但是太几把枯燥无味和繁琐了,流程都是重复的,就按照流程然后写成工具自动化改写了
有时候会遇到一些bug,成因是com接口调用繁忙,上一次调用的句柄还未释放,然后就已经到下个通报改写的调用了,就会造成图片插入失败

但其实影响不是不大,毕竟本身这个操作就是需要我手动微调的,不过也分两种情况

  1. 文档里没有插入设置为浮于文字上方的盖章样式图片
  2. 插入了但没保存,打开后要另存为才行,如下图所示

    然后就是微调完,点击转换pdf的按钮,那个就是专门转换通报的

word转pdf

界面如下

pdf提取

提取pdf用的,界面如下

预览