Photon是一個由s0md3v開源的情報搜集爬蟲,其主要功能有:
1.爬取鏈接(內(nèi)鏈、外鏈)。
2.爬取帶參數(shù)的鏈接,如(pythondict.com/test?id=2)。
3.文件(pdf, png, xml)。
4.密鑰(在前端代碼中不小心被釋放出來的)。
5.js文件和Endpoint(spring中比較重要的監(jiān)視器)
6.匹配自定義正則表達式的字符串。
7.子域名和DNS相關數(shù)據(jù)。
你可以用它來干很多事,比如爬圖片、找漏洞、找子域名、爬數(shù)據(jù)等等。
不僅如此,它甚至支持json格式 ,僅需要在輸入命令的時候加上json參數(shù):
python photon.py -u "http://example.com" --export=json
1、下載安裝
https://github.com/s0md3v/Photon/archive/refs/heads/master.zip
2、簡單使用
注意,使用的時候要在Photon文件夾下。比如我們隨便提取一個網(wǎng)站的URL試一下,在終端輸入以下命令:
python photon.py -u https://bk.tencent.com/
它會在當前目錄下產(chǎn)生一個你測試的域名的文件夾,比如在我這里是 bk.tencent.com:
結果如下:

嘻嘻,讓我們看看里面有什么東西,有沒有程序員留下的小彩蛋,打開external.txt,這是該網(wǎng)站的外鏈的存放位置。可以看到,這里不僅僅是只有網(wǎng)站頁面,連CDN文件地址都會放在這里,所以external可能是個藏寶庫哦。
3、擴展
這個項目的價值,不僅在于能夠快速拉取你想要得到的數(shù)據(jù),還在于能夠構建一個牛逼轟轟的情報系統(tǒng)(如果你技術夠強的話)。因為它是能不斷延伸下去的,比如從外鏈出發(fā),你能找到很多和這個網(wǎng)站相關的訊息。
相比于搜索引擎搜索的結果,實際上這些信息更符合情報的要求。因為存在禁止搜索引擎爬取的 robot.txt, 所以不是網(wǎng)站的所有信息都能在搜索引擎搜索得到,而通過這個Photon,你可以順藤摸瓜找到那些隱藏在互聯(lián)網(wǎng)世界的它們。
審核編輯:湯梓紅
-
開源
+關注
關注
3文章
3691瀏覽量
43851 -
python
+關注
關注
56文章
4827瀏覽量
86819 -
爬蟲
+關注
關注
0文章
83瀏覽量
7517 -
photon
+關注
關注
0文章
33瀏覽量
3785
發(fā)布評論請先 登錄
直流負載箱的主要功能有哪些?
繼電器的主要功能與應用
變頻電源的主要功能及特點
畫面分割器的主要功能
負載管理器的主要功能
數(shù)字化智能工廠的主要功能組成

自動調(diào)壓器的主要功能有哪些
電機控制器主要功能有哪些?其組成有哪些?
漏洞掃描的主要功能是什么
電子地圖的主要功能與應用

評論