• 首页
  • 电影
  • Js
  • 前端
  • 新旅
  • 奇技
  • 网安
  • 歌单
  • 关于
  • 搜索
  • 夜间模式
    ©2013-2025  成长小破站 Theme by OneBlog
    搜索
    标签
    # css # js # uniapp # ps # chrome # 小程序 # javascript # 布局 # typecho # 激活码
  • 首页>
  • 前端笔记>
  • 正文
  • python爬虫示例

    2023年08月16日 1.2 k 阅读 0 评论 941 字

    需求:读取wangzhi.txt文件内的网址,把想要的内容输入为文本

    import requests
    from bs4 import BeautifulSoup
    
    # 从文件中读取URL列表
    url_list = []
    with open('wangzhi.txt', 'r', encoding='utf-8') as file:
        for line in file:
            url = line.strip()
            if url:
                url_list.append(url)
    
    # 打开一个文本文件以写入结果
    with open('result.txt', 'w', encoding='utf-8') as file:
        for inurl in url_list:
            req = requests.get(url=inurl)
            req.encoding = "utf-8"
            html = req.text
            soup = BeautifulSoup(req.text, features="html.parser")
            pinzhong_items = soup.find_all(
                "h1") + soup.find_all("div", id="content")
            for pinzhong_item in pinzhong_items:
                dd = pinzhong_item.text.strip()
                # 将结果写入文件
                file.write(dd + '\n')
                file.write('=' * 50 + '\n')
    print("结果已保存到 result.txt 文件")
    本文著作权归作者 [ admin ] 享有,未经作者书面授权,禁止转载,封面图片来源于 [ 互联网 ] ,本文仅供个人学习、研究和欣赏使用。如有异议,请联系博主及时处理。
    python
    — END —
    首页电影Js前端新旅奇技网安歌单关于
    Copyright©2013-2025  All Rights Reserved.  Load:0.031 s
    豫公网安备41050202000235   豫ICP备18019224号-2
    Theme by OneBlog V3.6.4
    夜间模式

    开源不易,请尊重作者版权,保留基本的版权信息。