菜鸟IT的博客
"菜鸟IT"的博客 (WWW.17WX.NET)
熟悉HTML网站的前端美工到切图制作,搭配DIV+TABLE+CSS,熟悉Fireworks和Dreamwear的网站制作实战应用,专注于学习和记录JS脚本对于网页改造的各种新奇技术.平时的工作既要做销售,也要做前端开发,也要做后期的客户售后维护,此博客为博主自己平时的IT工作的实战学习笔记,记录自己工作和学习中遇到的各种坑,也分享给有需要的新人...
博客首页 网站前端制作 网赚 软件应用 Windows系统 Python
谷歌联盟提供的广告↓
[网站前端制作]有关标签↓
[网赚]有关标签↓
[软件应用]有关标签↓
[Windwos系统]有关标签↓
 | 
菜鸟IT的博客 >> Python

获取重定向之后的Url,然后再爬取数据。
# 先把查询单号进行强制大写
            TrackingNo_of_JT_INT=str(TrackingNo_X).upper()
            # ——————————————————————
            Url_Cookies2 = "http://www.kichisen-exp.com.cn/CenterWeb/trackingInfo.asp"
            Cookies_Post = C18_Class_Headers_Make.Headers_Make().Cookie_for_Headers_No_JiaMi_Post(Url_Post=Url_Cookies2, TimeoutN=6)
            print("获取Cookies【2】:", Cookies_Post)
            # 获取到的cookies样本:
            # ASPSESSIONIDSSTDTCRD=EPCBOFPDEEAACJLLOADPDLCK;

            Url_Cookies1 = "http://www.kichisen-exp.com.cn/CenterWeb/StepPage2.asp?Source=" + TrackingNo_X + "&Key="
            Cookies_Get = C18_Class_Headers_Make.Headers_Make().Cookie_for_Headers_No_JiaMi_Get(Url_Get=Url_Cookies1, TimeoutN=6)
            print("获取Cookies【1】:", Cookies_Get)

            Headers_1 = {
                'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9',
                'Accept-Encoding': 'gzip, deflate',
                'Accept-Language': 'zh-CN,zh;q=0.9',
                'Cache-Control': 'max-age=0',
                # 'Connection': 'keep-alive',
                'Connection': 'close',
                # 'Content-Length': '22', # 这个不用加。
                'Content-Type': 'application/x-www-form-urlencoded',
                'Cookie': Cookies_Post,
                'Host': 'www.kichisen-exp.com.cn',
                'Origin': 'http://www.kichisen-exp.com.cn',
                'Referer': 'http://www.kichisen-exp.com.cn/CenterWeb/index.asp',
                'Upgrade-Insecure-Requests': '1',
                'User-Agent': C3_Class_UserAgentRandom.UserAgentRandom().GetUserAgent_by_random(),
            }

            Req_1 = requests.get(url=Url_Cookies1, headers=Headers_1, timeout=10, verify=False)
            # 设定网页编码,避免出现乱码
            Req_1.encoding = "utf-8"

            # 获取响应状态码
            print("●--------√(1)--------获取响应状态码:", Req_1.status_code)
            Url_2 = Req_1.url
            print("●--------√(2)--------获取重定向之后的Url:", Url_2)

            Req_2 = requests.get(url=Url_2, headers=Headers_1, timeout=10, verify=False)
            # 设定网页编码,避免出现乱码
            Req_2.encoding = "utf-8"

            # 使用BeautiulSoup构造1个对象
            Soup_1 = BeautifulSoup(Req_2.text, "lxml")
            print("●--------√(3)--------获取重定向之后的Url的页面源码:", Soup_1)

            Soup_Table_1=Soup_1.find_all("table")
            print("●--------√(4)--------提取table代码的捕获结果:",Soup_Table_1)

菜鸟IT博客[2023.01.06-21:52] 访问:275
[关闭窗口]  
Google公司(谷歌联盟)提供的广告↓
本页的htm伪静态链接网址:分享链接加载中....

收藏链接: www.ems-help.com | www.17ckd.com | www.17post.com | m.17ckd.com | www.17track.wang | www.kd100.wang | www.17ckd.com/p1 | www.17ckd.com/p0 | www.17wx.net | www.17ckd.com/17tracking | www.11185cha.com | yf.17ckd.com | yfm.17ckd.com | www.sftrack.net | www.17htm.net | www.kdjiage.com | m.kdjiage.com | www.expba.net | m.expba.net | www.pptrack.net
学习Python的关键点
【1】★ Python:解决小数点后面四舍五入的精度丢失问题(二进制转换导致,另解决prec动态保留小数点后多少位)
【2】 ★ Python:单个py文件打包exe程序
【3】 ★ 给自己写的exe程序加上注册授权保护
【4】 ★ Python的http请求超时设置(timeout)| 异常类型/捕获异常
【5】 ★ Python的多线程的线程池的使用| ThreadPoolExecutor
【6】 ★ Python能用到的免费代理IP网址
【7】 ★ Python_用于测试代理IP是否有效
【8】 ★ Python Requests post() 方法 | post方式提交api
【9】 ★★★ Python Tkinter Gui视频学习教程
【10】 ★★★ Python 小项目实战-视频学习教程
【11】 ★★★ Python 爬虫项目实战-视频教程
【12】 ★★★ 高级进阶的关于python的五本书: 「Python从菜鸟到高手」、「html5+css3+JavaScript从入门到精通」、「Django Web应用开发实战」、「漫画算法」
【13】 ★★★ Request库-爬虫
【14】 ★★★ Python 图形识别文字
【15】 ★★★ Python 滑动验证码识别【图文教程】
【16】 ★★★ Python 滑动验证码识别【视频教程】
【18】 ★★★ Python 关于Class类的应用【视频教程】
【19.1】 ★★★ Python 关于进度条的制作(1)
【19.2】 ★★★ Python 关于进度条的制作(2)
【20】★★★ Python 抓取某宝的商品信息
【21】★★★ Python 一小时学会全栈开发浏览器版本的企业管理系统【视频教程】
【22】★★★ Python 全栈开发——前端+后端【视频教程】
【23】★★★ Layui 浏览器前端模块化UI框架
【24】★★★ Python-Django-Web应用开发【视频教程】
【25】★★★ Python 从0开始学【视频教程】
【26】★★★ Python的tkinter界面打包exe以后关于icon图标报错的解决办法!
【27】★★★ Python的tkinter视频学习教程【N个系统性学习合集视频】★★★
【28】★★★ Python全栈开发【视频教程】★★★
Copyright © 17WX.NET 版权所有 Manage 沪ICP备13006304号-5 沪公网安备31011702006630号
,sitemap.html,sitemap.xml
网站人气值: