頁面特效 UI組件庫 菜單導航 窗口特效 幻燈片滑動 圖像相冊 表單 選項卡 表格 評分星級 手風琴 文本鏈接 布局 日歷 顏色選擇器 按鈕 圖表 html5 提示 ExtJS 在線客服 其他特效 地圖 樹形控件 移動開發 BootStrap 滑動條 文件上傳 表單驗證 分頁 播放器 Angular VUE

爬小說時內容被js加密,怎么辦?

學了爬蟲后爬小說玩,一直比較順利,可最近遇到了一個用js加密內容的小說,讓我很是頭疼。這個小說章節是:
https://www.sztjgold.com/chapter.html?1#mybookid=96803&bookid=108841&chapterid=48935289
通過抓包到得真實網址是:https://www.sztjgold.com/files/article/html555/108/108841/48935289.html
結果得到一堆英文數據,經查百度是js數據。 猜測小說內容、解密函數、小說參數等都在數據中,格式化后的js數據表面看起來也很完美,但用js工具運行時卻老是提示錯誤,無法得到結果。猜測js數據中設計有讓js運行出錯的代碼。瀏覽器能運行它,是因為瀏覽器在得到這段數據后先對數據進行了處理,去除其中的錯誤數據。但要找到瀏覽器是怎么處理的,就應該很熟悉瀏覽器前端及js知識了。后來看了很多的文章,說selenium可以抓取,試了一下,果然行。但處理速度很慢慢,有些時候還爬取不下來。所以想請教論壇的大牛們幾個問題:
1、如何改寫這段js數據?思路、方法及有什么工具。
2、除了使用selenium外,還有沒有速度更快的方法?

附上我的方法:

相關鏈接

發表評論

2017怎样手机上赚钱