医软号

中国大陆爬虫从业者必看!违法案例助你避开数据合规红线

请注意啦,那些从事爬虫写作的人,难道你觉得仅仅抓取公开数据就不存在违法情形吗?在GitHub上,有一个被称作“中国爬虫违法案例”的开源项目,借助九个充满惨痛意味的真实案例向你表明,监狱的大门说不定会在你紧接着的下一次请求之际就呈现出敞开的状态。

为黑产提供服务同样犯罪

给违法违规的组织供应爬虫服务,这就如同给自己套上法律的绞索。在知乎上面当中,曾经有一位宣称破解极验验证码的技术高手,在发布帖子去炫耀自身的“成果”之后没有多久,便更新了一条消息表明自己被抓捕了,其原来的帖子随后完全消失不见。

爬虫法律风险_违章案例_非法爬虫案例

“快啊答题”AI给破解验证码服务搞开发的那些人,是特别典型的例子,他们弄出工具专门去助力黑产绕开验证码,最后全被判处刑罚了。永嘉警方端掉的那个“黑”百度黑客一群人,行径更离谱,靠着干扰搜索引擎搞钱超出七千万元,这些家伙全把技术用在了错误的方向上。

个人隐私数据是高压线

巧达科技宣称自己是简历大数据公司,手里有着数亿份简历,然而却被一网打尽,该公司的所有高管都去监狱服刑了。他们觉得把数据进行脱敏处理就不会有问题,却不知道收集数据这个行为从一开始就是违法的。

社保掌上通App遭下架之事,好多人都还记得,用户查询社保时,个人信息全然泄露了。在业内,大家都清楚,不少大数据服务商因给套路贷平台提供数据,从而被牵连了进去,触碰爬取个人隐私数据这条红线,一旦触碰就彻底完了。

商业数据版权不可侵犯

涉嫌偷数据的“车来了”被警方立案,由此直接告知行业这样一个事实,别人家的商业数据,并非是你想要去爬就能够爬取的,他们借助爬虫手段抓取竞争对手的核心数据,最终致使自身被送上了被告席。

依照常理,裁判文书网的数据是公开的,然而,却存在有人将其爬取下来并进行打包售卖的情况,这种行为同样构成侵权。公开的数据并不意味着能够用于商业化利用,更不意味着可以直接拿来售卖赚钱,正是这个认知上的误区致使不少人受到了不良影响。

内部人员反噬风险巨大

位于头疼大战前传这段情节里被判刑的头条前高管事例,给所有从业者敲响警钟,其曾利用职务获取数据,离职后竟用这些数据干坏事,而这样的行为同样被认定为非法获取计算机系统数据。

众多程序员持这样的观点 ,即只要并非黑客发动的攻击 ,便是安然无事了 ,可实际上 ,出自内部人员之手的作案行为 ,更难以实现逃脱。公司内部所拥有的数据权限 ,并非是供你随意去使用的 ,更不是你离职之后可当作创业资本的 ,此案件的判决丝毫不存在冤枉之处。

相关法律条款你必须懂

有关非法获取计算机系统数据罪的规定表明,存在侵入计算机系统进而获取数据的行为,当这种行为情节严重时,会被判处三年以下有期徒刑。倘若情节特别严重,等待着的便是三年以上七年以下的刑罚,不要以为仅仅是罚钱就可以了事。

侵犯公民个人信息罪更为严厉,非法获取诸如行踪轨迹、通信内容等达到50条以上便构成犯罪,住宿信息、交易信息达500条以上,普通个人信息达5000条以上,均足以被判刑。

合规爬虫才能走得远

网络安全法第四十四条作出过清晰明确规定,任何个人以及组织均不得非法去获取个人信息。民法总则同样着重强调,获取他人信息必须依据法律来取得,不要觉得凭借技术手段进行隐蔽操作就不会被查到你。

专业律师周浩剖析,通过爬虫的方式去获取数据,务必要考量是否存在授权的情况,还要考量是否会侵犯商业秘密。金杜律所同样表明,在数据方面产生的纷争背后皆为法律红线,要是不懂法律就去编写爬虫程序,那就等同于给自己挖掘陷阱。

现当下你所拥有的爬虫代码,其中存不存在某一行具备会将你送进里面去的可能性呢?于评论区域交流交流你针对此的看法,进行点赞以及分享的操作,从而促使更多同行业的人可以看到这些饱含血泪方面的教训。

非法爬虫案例_爬虫法律风险_违章案例

admin
admin
这个人很神秘