前邊宏哥拖拽有提到那個反爬蟲機制,加了各種引數,以及載入js指令碼檔案還是有問題,偶爾宏哥好像發現瞭解決問題的辦法,看到了黎明的曙光,宏哥就說試一下看看行不行,萬一實現了。結果宏哥試了結果真的OK啊,但是宏哥第一次執行可以,後邊就不行了,然後將編輯器關閉重啟,再次執行又可以,宏哥猜測可能是緩衝問題吧,但是具體原因還是沒有查到。所以就加更一篇來記錄是如何解決的。而且最近有一些爬蟲使用者私信給宏哥留言:在使用 playwright 的時候,提到 playwright 預設是用無痕模式開啟的瀏覽器,很多網站會有反爬機制,使用無痕模式開啟的時候功能無法正常使用。問宏哥有沒有好的辦法。宏哥答覆暫時也沒有好辦法,也不知道宏哥這種解決方法會不會幫到他們,或者對他們有參考價值。
playwright 提供了 launch_persistent_context 啟動瀏覽器的方法,可以非無痕模式啟動瀏覽器。
無痕模式啟動瀏覽器適合做自動化測試的人員
非無痕模式啟動瀏覽器適合一些爬蟲使用者人員
launch()方法是無痕模式啟動瀏覽器。
參考程式碼如下:
# coding=utf-8