免责声明:本文所有文字、图片及相关外部链接直接或间接、明示或暗示涉及性别、外貌评分等信息均由相关人脸检测界面给出。不客观mac上的抓取软件,仅供参考。
1 个数据源
出现在“美女”主题下所有问题的答案中的图片
2 爬虫
3、使用第三方库,lxml,100+行代码
3 必要的环境
mac/linux/(linux没测试过,理论上是可以的。之前的回复有很多异常,后期检查限制了本地文件名中的字符,并使用了正则过滤) ,无需登录知乎(即无需提供知乎账号和密码)mac上的抓取软件,人脸检测服务需要百度云账号(即百度网盘/贴吧账号)
4 人脸检测库
由百度云AI开放平台提供,是一个可以进行人脸检测的SDK。可通过HTTP直接访问,免费使用
5 检测过滤条件
6 实现逻辑
7 获取结果
直接存放在文件夹中(强度出口)。另外,目前为止拍摄的照片,除了婴儿以外,得分为88分,是最高分。个人反对其中的排名,老婆不是最高分
8 个代码
本文中的代码有 100 行长。鉴于微信公众号代码阅读体验不佳,小编已将源码保存。请到微信公众号后台回复关键词“知乎爬虫”获取。
微信后台传送门
9 操作准备
需要登录,百度账号可以直接使用(贴吧/网盘通用),没有人只能注册
点击创建应用
只需填写
在代码中填写AppID
{ "error": { "message": "ZERR_NO_AUTH_TOKEN", "code": 100, "name": "AuthenticationInvalidRequest" } }
浏览器;找到知乎链接点击,打开开发者工具,查看HTTP请求;无需登录
10 结论
❈
发表评论