51信用卡为什么被查?Python 告诉你!

简介: 51信用卡为什么被查?Python 告诉你!

阅读文本大概需要 6 分钟。

10月21日上午,在香港上市的金融独角兽 “51信用卡”遭遇杭州警方突击清查

据现场知情人士透露,“51信用卡”位于杭州西湖区紫霞街80号西溪谷国际商务中心的办公楼下,停满了12辆警车,包括4辆大巴车以及1辆特警大巴车

受此消息影响,51信用卡紧急停牌,停牌前报1.78港元,跌幅高达34.32%,成交8871万港元,最新总市值21.26亿港元。该股盘中股价最低640.jpg至1.58港元,一度跌幅超过40%,为上市以来最低价。


一时间市场上议论纷纷,有传是因为爬虫,非法收集个人隐私信息

640.jpg

640.png


因为近段时间很多大数据服务公司爬虫被查,魔蝎科技,新颜科技,公信宝等。这些大数据公司基本都是为现金贷,p2p 等公司提供数据服务的。

因为公众号读者中做爬虫的可能居多,在这里也和大家提个醒,注意以下几点:

1.个人隐私千万千万不要去爬取

今年的这些行动最主要就是打击违法收集个人隐私信息的,以后遇到这种任务直接和领导说或者找公司法务,将这些案列丢给领导看!如果还要你去采集,你也要拒绝,同时可以准备找下家了,因为这种公司迟早会被查。不要说什么技术无罪,爬虫是你开发出来的,你成年人了应该懂法吧,上一个说技术无罪的,去年才从里面出来!

2. 不要把别人服务器爬崩了

说白了就是不要把别人网站爬的不能正常访问,也就是大家常说的 Dos 攻击。注意爬取速度,不要毫无限制的追求速度!当然这里说的是爬取公开的数据,非公开的数据也不能乱爬!

3. 不要乱接外包私活

也是前段时间一篇刷屏的文章。一位老哥因为接的私活,进去了。因为你不知道对方拿你开发完的东西去做什么的,他有可能拿你开发的去做了什么违法的事情,那么开发这个工具的人也是有责任的!

暂时说这么多,大家要做到心中有数,要懂得敬畏法律!

联想到最近出事的大数据金融公司,市场上很多关于 ”51信用卡“ 因为爬虫出问题的猜测也不足为奇了!然而 “51信用卡” 并不是因为爬虫出问题,后面杭州警方官方通告出来了

640.jpg

原来51信用卡涉嫌暴力催收,寻衅滋事等。像51信用卡这种大公司因为暴力催收被查,肯定不是一两件,必定是造成了很恶劣的影响,有多严重呢?

你的电话可能会被打爆,很多都是那种恐吓,辱骂的电话…

640.jpg

不仅是你自己的电话,你通讯录里面的朋友,家人和同事都会被电话催债。而且你还屏蔽不掉,只能关机!

640.jpg

不仅如此,你还可能被人肉追踪,催收方能准确的知道你的位置在哪!想想都觉得可怕吧!

这些暴力催收投诉信息都能在网上查到,都属于公开信息

640.jpg

高利贷、暴力催收、高额利息、砍头息…这些都是今年重点打击的..

所以我写了个爬虫把这些公开信息都爬下来了,总共有 4000 多条的投诉数据,这还是只是针对 51人品贷 这一个产品

640.jpg

下面是部分的爬虫的代码:

def crawl_news():
    data_list = []
    for page in range(1, 11):
        url = f"https://ts.21cn.com/json/merchantPostList/merchantId/3155/listType/1/pageNo/{page}/offset/28f13d759fd1e08c"
        headers = {
            "User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) "
                          "AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36",
        }
        data_list = []
        title_set = set()
        try:
            response = requests.get(url,headers=headers, )
            json_data = response.json()
            print(json_data)
            post_list = json_data.get('postList')
        except:
            print(traceback.format_exc())
            pass
        else:
            for item in post_list:
                title = item.get('title')
                if title in title_set:
                    continue
                else:
                    title_set.add(title)
                intro = item.get('shortTopic')
                t = time.localtime(item.get("ctime"))
                publish = time.strftime("%Y-%m-%d",t)
                link = 'http://ts.21cn.com/tousu/show/id/' + str(item.get('id'))
                data_list.append({
                    NewsKeyEnum.TITLE: title,
                    NewsKeyEnum.ABSTRACT: intro,
                    NewsKeyEnum.LINK: link,
                    NewsKeyEnum.PUBLISH: publish,
                })
                time.sleep(0.5)
    return data_list

这里根据爬取的数据简单的做了个词云图,可以看到里面充斥着大量的贷款,违规,高利贷,砍头息...


640.jpg

最后再额外提醒一下,大家千万别再碰任何匹凸匹理财产品了,这个行业基本上完了,如果你持有匹凸匹理财产品赶紧退出来吧。另外做爬虫的朋友也没有必要人人自危,注意上面几点,对有些地方拿捏不准的可以咨询公司法务,做到心中有法,敬畏法律,不要去越过红线。

相关文章
|
Python
python基础练习(一)
python基础练习(一)
118 0
|
8月前
|
JavaScript 前端开发 Java
python基础详解
python基础详解
|
Go Ruby Python
Python(三十四)python的包
我们在实际开发中,可能需要应用到多个模块,使用模块可以有效避免变量名或函数名重名引发的冲突,为了方便管理,python为我们提供了包的概念。 什么是包呢?简单理解,包就是目录,只不过在该目录下必须存在一个名为“init.py” 的文件。 注意,这是 Python 2.x 的规定,而在 Python 3.x 中,init.py 对包来说,并不是必须的。 一:创建包 如下图所示: 二:init.py文件 就如上边所说,python3包中__init__.py文件不是必须的。但是有也是没有问题的。 对于__init__.py文件来说,首先是一个python文件,所有还可以用来写pytho
71 0
|
IDE 程序员 开发工具
22【Python基础】VS2019中使用Python及安装Python包
要使用Python语言来写一些程序,使用哪个IDE是个问题,若是专业开发Python,PyCharm无疑是最佳选择,作为使用VS较多的程序员,直接在VS中写Python是个不错的选择。本文主要介绍VS2019中安装Python环境、安装后环境配置、使用pip install ***安装Python包的过程。
360 0
|
前端开发 编译器 数据库
用Python写个在线Python的网站怎么样
用Python写个在线Python的网站怎么样
121 0
|
人工智能 缓存 JavaScript
python基础
python基础
105 0
|
Python
python套利系列之价差分析--python学习笔记22
python套利系列之价差分析--python学习笔记22
139 0
python套利系列之价差分析--python学习笔记22
|
Python
python小知识-如何管理你的python包
python的包都存放PyPI中,PyPI即Python Package Index,是python的软件仓库。所有的python包都可以在PyPI中下载并安装
439 0
python小知识-如何管理你的python包
|
Python
Python基础(8)
Python基础(8)
138 0
Python基础(8)
|
Python
Python写银行系统
Python两种银行系统对比简单易懂适合小白,都是干货,看完收获满满。
195 0
Python写银行系统