个人数据泄漏检测网站 - 搭建指南
这是一份kallydev/privacy项目的搭建指南,用于查询8亿QQ手机绑定数据。此项目仅用于查询个人信息泄露情况,请勿用于非法目的。
秉持能用就行的原则,文中的代码可能涉及权限配置问题,敬请注意。
此外,如果只是想直接搜索大文件,可以试试ripgrep软件。
安装WSL
我是在Windows平台搭建此项目的。如果有原生Linux服务器那再好不过,请跳过本段。
WSL即Windows Subsystem for Linux,能够在Windows 10上直接跑一个Linux。(除非你在WSL里下载裤子,否则)因为涉及到Windows与WSL的文件交换,所以安装WSL1比较方便。
WSL安装教程
安装WSL1仅需第1、6、7步。我选择的是Ubuntu 18.04 LTS。
记得预留出足够的C盘空间。建立索引后的数据库约为50GB。
导入数据
按照使用教程处理数据。可以先做这一部分,因为仅导入数据就要约1小时。
导入脚本扫描完就可以看到,QQ库有719806832行,而JD库有141639667行。
由于我在Windows里操作数据库,JD库是UTF-8编码,跑导入脚本会以gbk方式读取导致乱码,所以在jd.py里要把两处读取命令“open(self.file_path)”改成:
open(self.file_path, encoding='utf-8', errors='ignore')
导入完JD库之后可以用这个命令看看是不是乱码:
sqlite3 database.db //进入sqlite之后执行SQL语句,看看第一行的名字是不是乱码 SELECT * FROM jd LIMIT 1;
安装项目
//首先把软件源换了 sudo vi /etc/apt/sources.list //在命令模式下替换文本 :%s/archive.ubuntu.com/mirrors.aliyun.com :%s/security.ubuntu.com/mirrors.aliyun.com //:wq保存文件 sudo apt-get update
//装依赖 sudo apt install npm sudo npm install -g yarn sudo add-apt-repository ppa:longsleep/golang-backports sudo apt-get install golang-go sudo npm install -g n n stable
//编译前后端 git clone https://github.com/ff98sha/privacy cd ./privacy/website yarn install yarn build cd ../server go build -o app main/main.go
//启动 cp ../config.yaml config.yaml vi config.yaml //然后修改配置文件中数据库地址,电脑的磁盘是直接挂载在/mnt下的,注意Windows路径中斜杠需要换方向 //将第二行path后面的数据库路径换成你数据库的路径,如:/mnt/d/folder/database/database.db //然后运行程序 sudo ./app --config config.yaml
这时打开localhost能看到网页已经跑起来了。
提醒:若要查看不打码的信息,请在config.yaml里把mask参数改为false。
现有运行本服务的网站:https://privacy.aiuys.com/
后端编译报错
甚至不po出错误内容……
请问原作者,无能为力
这难道不应该贴一个链接 "提问的智慧"?
《提问的智慧》