"""使用urllib.request()请求一个网页内容,并且把内容打印出来。"""from urllib import requestimport chardetif __name__ == '__main__':    # 有的网站url使用不了    url = "https://www.cnblogs.com/gshelldon/p/13332798.html"    # 打开url把内容赋值给rsp    rsp = request.urlopen(url)    # 存取到内存当中是bytes流,使用read方法把rsp的内容读取出来,赋值给变量html。    html = rsp.read()    # 使用decode解码成我们能够看懂的格式。    # print(type(html))         # 查看返回的格式    html = html.decode('utf-8')  # 默认的是utf-8    print(html)

返回的内容是html格式的文本


D:\ProgramData\Anaconda3\envs\spider\python.exe D:/爬虫/v1-最简单的爬虫.py<!DOCTYPE html><html lang="zh-cn"><head>    <meta charset="utf-8" />    <meta name="viewport" content="width=device-width, initial-scale=1.0" />    <meta name="referrer" content="origin" />    <meta property="og:description" content="nginx 动静分离 不需要运维来做,开发做的。 动态请求:该请求会调用数据库中的数据。 静态请求:用户请求不会调用数据库。 动态页面:后端开发写的需要调用数据库的页面(python、java、C、p" />    <meta http-equiv="Cache-Control" content="no-transform" /> 省略。。。。。。。
©著作权归作者所有:来自51CTO博客作者80民工的原创作品,如需转载,请注明出处,否则将追究法律责任

更多相关文章

  1. Requests库快速学习
  2. ADAS系统传统燃油车动力执行策略详解(一)
  3. 【DB笔试面试822】在Oracle中,AWR报告中主要关注哪些方面内容?
  4. 【秒杀】一、系统设计要点,从卖病鹅说起
  5. 深入了解Nginx
  6. 【jQuery基础入门】jQuery中常用Dom操作总结及Ajax异步请求和jso
  7. Cookie和Session
  8. Web应用优化 - 压缩内容传输量
  9. Python爬虫:如何将Request Payload添加到请求中

随机推荐

  1. 明天 你看好Erlang还是看好android
  2. TableLayout设置行与行之间的分割线
  3. Android 6.0及运行时权限处理
  4. [置顶] Android 各类功能效果源代码集合
  5. Android设置android:clipChildren达到的
  6. android的大好时光结束进行时
  7. 王家林的81门一站式云计算分布式大数据&
  8. Android串口Serial服务解析
  9. Android技术专家 高焕堂 推荐这本书
  10. Android音乐播放器系列讲解之一