title: 1 非法爬取事件经过 date: 2024-11-28
你好,我是郭震 某公司使用Python抓取高德地图数据,法院判决该公司赔偿1250万元: 很多铁铁日常使用Python爬天爬地,也还有很多想学爬虫来自动获取数据。
爬虫确实是学习Python最有意思的一件事情,也是Python很擅长的事情之一。
但是法律法规容不得触犯。
那么爬虫的底线是什么,这篇文章我来总结下,建议阅读,也欢迎指正。
1 非法爬取事件经过
某IT公司在未经授权的情况下非法抓取了高德地图“拥堵延时指数”的数据。
这个数据简单来说就是看堵不堵车的指标。
结果被判罚1250万:
该公司抓取了堵不堵车的数据后,将其存储在自家公司数据库中,以商业目的牟取经济利益,如下图看到存储的数据:
再看看法院判决的理由:
法院认为:其损害了原告公司的合法权益及消费者利益,破坏了数据领域中的市场竞争秩序,构成不正当竞争。
接下来就是重点,总结三条Python爬虫底线:
爬虫底线1:公司A是数据的生产方,公司B是爬取方。公司B若拿数据去盈利,对公司A就是不正常竞争. 这起案件实际就是触发了底线1.
爬虫底线2:恶意攻击服务器,如DDoS攻击、登录暴力破解,给生产服务器带来巨大负荷,甚至宕机,给公司带来经济亏损。
爬虫底线3:不采集敏感个人信息,如身份证号、信用卡信息等。
以上三条线,一定不要越过,平时就要养成好习惯。
Python爬虫很行,但用不得当,最后就会变成很刑!
看看这里有些铁铁发抖了吗?
其实不必过于紧张。
大家平时爬虫数据,大多时候只是个人使用,那就无妨,没人管你。
但依然注意不要触碰底线2和3.
2 除了爬虫,Python还擅长什么?
如果你一点都不愿意去触碰爬虫。
那么学习AI大模型是一个很好的选择,看看AI大模型的薪酬和待遇:
人均年薪100万哈,虽然很多公司达不到这种薪酬,但是这代表了一个风口,多学习一下,一定不是坏事:
这个是微软开源的,但是全部英文,学习起来对有些老铁不友好,我翻译为中文,现在可以在线学习:
这个课一共7节课时,真正的零基础AI小白通识课,教程质量还是很高,这种图解释了AI大模型的基本参数:
学完课后另外还配有三道练习题:
建议大家收藏好这篇文章,找时间把这7节课学完。
记好下面地址:
https://ai-jupyter.com/llm-basics/
进入后看到这个页面:
教程大纲,一共7节,展示前三节讲解内容:
剩余节教程,大家自行查看网页,或在手机上完成学习。
3 AI教程网站推荐** **
我的网站
https://ai-jupyter
在线版包括了常用的算法,机器学习,深度学习,大模型的基础教程
第一,一个普通人学习路线图及我做的开源教程,完全免费获取。
咱们先别弄那些高深的AI理论,先玩熟AI基本概念、AI工具、自己电脑搭建AI和知识库。
pdf指南思维导图
pdf首页截图
这个《普通人学AI指南》PDF,一共42页,都是我来编写的,完全开源免费,大家在我下面的公众号回复:AI指南,直接拿走。
两个星期,你就通过AI,大幅提升你的生产力!
第二,最近我上线了一个AI工具集,里面有比较多的AI工具分类,另外还有我集成的一个在线编程工具,免费使用。国内朋友访问:ai-jupyter.com
还有每天更新的AI热点新闻
以上全文,欢迎继续阅读学习