国产精品又长又粗又爽又黄的毛片, 国产AV无码专区亚洲AV毛片搜, 丰满人妻被猛烈进入中文字幕四川, 国产精品一区二区三区国产女人喷,亚洲国产欧美日韩图片在线人,潘娇娇337p人艺体艺术,成人免费无码大片a毛片古装,一本到高清视频免费,人妻在线视频免费看

更新于 3月17日

急招爬蟲工程師,雙休,團隊氛圍好

6000-8000元
  • 合肥蜀山區(qū)
  • 1-3年
  • 學歷不限
  • 全職
  • 招1人

職位描述

Python新媒體電子商務在線音樂/視頻/閱讀互聯(lián)網(wǎng)云計算/大數(shù)據(jù)
崗位職責
1. 數(shù)據(jù)抓取實現(xiàn):根據(jù)業(yè)務需求,負責海外電商、社交、新聞類網(wǎng)站的爬蟲開發(fā)與日常維護。
2. 動態(tài)渲染處理:運用自動化工具抓取 JS 渲染的動態(tài)頁面,確保數(shù)據(jù)的完整性。
3. 多媒體采集:負責圖片、音視頻資源的下載及基礎分類存儲,處理簡單的格式兼容性問題。
4. 反爬應對:處理常見的驗證碼、IP 頻率限制及簡單的混淆加密邏輯。
5. 數(shù)據(jù)清洗:對抓取到的非結構化數(shù)據(jù)進行清洗、去重,并導入數(shù)據(jù)庫。
任職要求
1. 工作經(jīng)驗1-3年,學歷不限
2. 核心技術基礎
編程語言:熟練掌握 Python,代碼風格規(guī)范,熟悉多線程、多進程及 asyncio 異步編程。
爬蟲框架:熟練使用 Scrapy、Requests 或 Playwright 等主流爬蟲框架及庫。
數(shù)據(jù)解析:精通 JSONPath、XPath、BeautifulSoup 或正則提取,能高效處理復雜的 HTML 結構。
3. 網(wǎng)頁技術與模擬
自動化工具:熟悉 Playwright 或 Selenium,能夠模擬人工點擊、滾動、翻頁等交互操作。
抓包分析:熟練使用 Chrome DevTools、Fiddler 或 Charles 進行網(wǎng)絡請求分析,定位關鍵數(shù)據(jù)接口。
基礎逆向:了解常見的 JS 加密邏輯(如 MD5、Base64、簡單的時間戳加密),能處理基礎的 Cookie 校驗。
專項與加分項
● 多媒體處理:了解 FFmpeg 或 Pillow,能完成基礎的視頻轉碼、圖片裁剪或封面抓取。
● 海外環(huán)境:有海外代理(如 Bright Data, Oxylabs)使用經(jīng)驗,了解如何在海外服務器上部署爬蟲。
● 存儲能力:熟悉 MongoDB、Redis 或 MySQL,能編寫高效的增量抓取邏輯

工作地點

蜀山區(qū)合肥創(chuàng)新創(chuàng)業(yè)園0

認證資質(zhì)

營業(yè)執(zhí)照信息

職位發(fā)布者

趙先生/HR

昨日活躍
立即溝通
公司Logo新宇智慧
深圳新宇智慧科技有限公司,前身為深圳市立創(chuàng)翻譯有限公司。是翻譯行業(yè)領先的語言技術解決方案的供應商。我們?yōu)閲H化公司、政府、個人提供全方位的多語言服務以及相關的技術解決方案和服務。幫助客戶在國際市場上獲得成功。我們以客戶的需求為導向,聚焦在語言領域不斷創(chuàng)新,精益求精,使公司始終處于行業(yè)前沿。公司總部設在具有中國珠三角“曼哈頓”美稱的深圳前海經(jīng)濟開發(fā)區(qū),在合肥設有制作中心,北京、香港設有分公司,同時在上海、劍橋設有辦事處。深圳市立創(chuàng)信息系統(tǒng)有限公司(公司網(wǎng)址:http://www.hkgsl.com)公司福利:周末雙休,帶薪年假,五險一金,節(jié)日福利,專業(yè)培訓,立即上崗,彈性工作,員工旅游,英語角等公司理念:“客戶為先、員工為本、精誠服務、追求卓越”公司愿景:“客戶全球化最佳合作伙伴”
公司主頁