js-15:js逆向总结
JS 总结 15 逆向
2023-09-14 09:00:32 时间
###
总结
###
###
第一个,案例,比赛第4题,
他的每一个数字都是一个图片,所以你需要把图片都识别出来,
另外就是这个图片做了偏移,我们要还原出来,
---
怎么还原?
前面宽度之和+偏移量,
偏移量又是什么?
有left和right,还有正负,
我们要首先知道每一个字体的宽度是多少,然后就是前面宽度之和+偏移量,就是
第一个数字的,前面宽度之和肯定是0,因为前面没有数字,
第四个,动态字体反爬,这个需要使用KNN算法,
比赛题目第七题,就是这个
往上有现成的knn算法的实现,
到时候还是需要学一学,
静态css反爬,利用字体
反爬原理:
1、主要利用font-family属性,例如设置为my-font
2、在HTML里面不常见(不可读)的unicode
3、在CSS字体(my-font)中将其映射到常见(可读)到字体,例如数字
4、爬虫在抓取数据的时候只能抓到unicode,而不是真实的数据
应对措施
1、下载woff字体文件,转化为tff文件
2、用百度字体编辑器打开tff文件,并确定其unicode与其实际的映射关系
3、将下载的HTML内容按照映射关系替换
4、解析HTML并获取正确的数据
难点:
有些网站会动态生成woff,这种反爬措施比较难以自动化绕开
练习题,第12题,
雪碧图反爬
https://gz.ziroom.com/z/,自如租房的价格就是时候的雪碧图反爬,
目前已知的几个字体反爬的网站是猫眼,汽车之家,天眼查,起点中文网等等。
###
这个是一个新型的反爬手段,
###
###
###
###
###
####
####
###
######
相关文章
- JS 使用 lz-string存储 数据压缩
- js 解密 16进制转10进制,再取ascii码的对应值
- JS框架_(JQuery.js)纯css3进度条动画
- JS框架_(JQuery.js)圆形多选菜单选项
- js 原型的内存分析
- JS魔法堂:属性、特性,傻傻分不清楚
- [Node.js] Polling
- jquery.form.js失效问题。
- 03. WebApp2.0时代启程:Cocos2d-JS让C++代码支持JS脚本(三)
- [Node.js] Mock an API for Local Development in React with Mirage JS
- vue.js 3.2.22:用useIntersectionObserver监控多行数据的可见性(@vueuse/core@7.0.3)
- js小案例:定时轮播图
- SAP Spartacus 启动时 Chrome 里观察到的 product.js
- Atitit 定时器timer 总结 目录 1.1. Js定时器 window.setInterval1 2. Java定时器 timer1 1.1.Js定时器 window.setInter
- Atitit react 详细使用总结 绑定列表显示 attilax总结 1. 前言1 1.1. 资料数量在百度内的数量对比1 1.2. 版本16 v15.6.11 1.3. 引入js2
- Atitit。Js调用后台语言 java c# php swing android swt的方法大总结
- atitit.js javascript 调用c# java php后台语言api html5交互的原理与总结p97
- atitit. js 跨界面 页面 web cs 传值方法总结
- 华为OD机试 - 猜数字(Java & JS & Python)
- 华为OD机试 - 冗余覆盖(Java & JS & Python)
- 数据滚动大屏:Stimulsoft Dashboards.JS 2023.1.2
- 【华为云技术分享】【一统江湖的大前端】PPT制作库impress.js
- js 常用正则表达式
- How to set up a Headless Chrome Node.js server in Docker
- 【JS高级】js之闭包对象_04
- JS-WebAPIs DOM总结
- JS截取字符串(3种方法)