Python基础进阶之海量表情包多线程爬虫功能的实现

脚本专栏 2025/4/17 佚名

3 2 1

一、前言

在我们日常聊天的过程中会使用大量的表情包，那么如何去获取表情包资源呢"htmlcode">

import os
import requests
from bs4 import BeautifulSoup

四、功能

# 多线程程序需要用到的一些包
# 队列
from queue import Queue
from threading import Thread

五、环境配置

解释器 python3.6
编辑器 pycharm专业版激活码

六、多线程类代码

# 多线程类
class Download_Images(Thread):
  # 重写构造函数
  def __init__(self, queue, path):
    Thread.__init__(self)
    # 类属性
    self.queue = queue
    self.path = path
    if not os.path.exists(path):
      os.mkdir(path)
  def run(self) -> None:
    while True:
      # 图片资源的url链接地址
      url = self.queue.get()
      try:
        download_images(url, self.path)
      except:
        print('下载失败')
      finally:
        # 当爬虫程序执行完成/出错中断之后发送消息给线程 代表线程必须停止执行
        self.queue.task_done()

七、爬虫代码

# 爬虫代码
def download_images(url, path):
  headers = {
    'User-Agent':
      'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36'
  }
  response = requests.get(url, headers=headers)
  soup = BeautifulSoup(response.text, 'lxml')
  img_list = soup.find_all('img', class_='ui image lazy')
  for img in img_list:
    image_title = img['title']
    image_url = img['data-original']

    try:
      with open(path + image_title + os.path.splitext(image_url)[-1], 'wb') as f:
        image = requests.get(image_url, headers=headers).content
        print('正在保存图片:', image_title)
        f.write(image)
        print('保存成功:', image_title)
    except:
      pass

if __name__ == '__main__':
  _url = 'https://fabiaoqing.com/biaoqing/lists/page/{page}.html'
  urls = [_url.format(page=page) for page in range(1, 201)]
  queue = Queue()
  path = './threading_images/'
  for x in range(10):
    worker = Download_Images(queue, path)
    worker.daemon = True
    worker.start()
  for url in urls:
    queue.put(url)
  queue.join()
  print('下载完成...')

八、爬取效果图片

Python多线程爬虫,python,海量表情包多线程爬虫

标签：

Python多线程爬虫,python,海量表情包多线程爬虫

免责声明：本站文章均来自网站采集或用户投稿，网站不提供任何软件下载或自行开发的软件！如有用户或公司发现本站内容信息存在侵权行为，请邮件告知！ 858582#qq.com

内蒙古资源网 Copyright www.nmgbbs.com

评论“Python基础进阶之海量表情包多线程爬虫功能的实现”

Python基础进阶之海量表情包多线程爬虫功能的实现

暂无“Python基础进阶之海量表情包多线程爬虫功能的实现”评论...

Python基础进阶之海量表情包多线程爬虫功能的实现

一、前言

四、功能

五、环境配置

六、多线程类代码

七、爬虫代码

八、爬取效果图片

Python多线程爬虫,python,海量表情包多线程爬虫

Python非单向递归函数如何返回全部结果

python复合条件下的字典排序

评论“Python基础进阶之海量表情包多线程爬虫功能的实现”

P70系列延期，华为新旗舰将在下月发布

友情链接

Python基础进阶之海量表情包多线程爬虫功能的实现

一、前言

四、 功能

五、环境配置

六、多线程类代码

七、爬虫代码

八、爬取效果图片

Python多线程爬虫,python,海量表情包多线程爬虫

Python非单向递归函数如何返回全部结果

python复合条件下的字典排序

评论“Python基础进阶之海量表情包多线程爬虫功能的实现”

P70系列延期，华为新旗舰将在下月发布

友情链接

四、功能