欢迎来到天天培训网!全国[切换城市] 登录 注册
首页 发布课程 机构平台 手机浏览

手机扫一扫

咨询热线

400-0808-102

python爬虫入门常用库

天天培训网络中心   2022-11-21 阅读:15
python爬虫入门常用库

 


列表的元素是可以变动的,比如增加、删除、修改,不过需要注意的是,列表的元素不是基本数据类型,都是一个个的标识符引用对象。以下是小编为你整理的python爬虫入门常用库



如图,先定义一个列表



a = [123,"456"]



一个是int类型,一个是str类型



添加一个元素,使用append



比如a.append(789)



括号中的就是要添加的元素



python爬虫入门常用库



在指定位置添加元素,使用insert



比如a.insert(1,"ABC")



括号中前面的是指定位置,后面的是要插入添加的元素



注意:位置从0开始,比如当前[123, "456", 789]



123是位置0,"456"是位置1,789是位置3



insert(1."ABC")的意思是,在位置1插入"ABC",而位置1和之后的都往后挪动一位



先定义一个列表



a = [123, "ABC", "456", 789, 123]



删除指定对象,使用remove



比如:a.remove(123)



注意:它不会把列表里面的所有123都删,只会删除最前面的与一个



3



如果你删除的指定对象不存在的话,那么会报错



比如:列表没有999这个元素,你非要删除这个元素的话,会报错



如何去下载



百度搜索“Python”,在官网中选择Python2.7,在选择列表项上双击即可下载;(Ps:虽然现在Python已经出到3.6版本,但由于版本差别不会特别大,而且公司项目使用的是旧版本的2.x,所以还是先从2.x开始)



双击下载好的Python2.7,进入安装界面,选择软件的使用用户,默认下一步即可;



设置Python2.7的安装目录,一般都为系统根目录下(C盘),默认即可;



进入程序组件安装界面,拉取下拉框,选择安装组件“Add python.exe to Path”,然后点击“Next”,默认安装即可;



不多时,即可看到安装完成界面



此外,由安装了组件“Add python.exe to Path”也不需再配置Python的环境变量,它已经自动配置好了,查看如图可知;



测试Python2.7是否已经正确安装完成,按下“win”+“R”键,输入“cmd”,点击确定,在弹出的命令行窗口中输入“Python”命令,即可看到电脑中已经安装好的Python;



python的优点



简单,python主张的是极简主义,学python就像在学英语一样。



易学,学习python并不难,入门很快很简单,比c++,JAVA容易多了。



python的优点



开源,python是免费开源产品,你可以自由地发布python这个软件,不用担心盗版和侵权。



自动内存管理,内存溢出一直以来都是很头疼的事情,而python则是自己自动管理内存的。



可以移植 ,python无论在windows和linux上都可以直接运行、。



可扩展,python还可以嵌入其他的语言,比如java和c++等。



但同时python也有自己的缺点,那就是运行的速度比起c++来说速度是慢了10倍的。



什么是爬虫



网络爬虫(又被称为网页蜘蛛,网络机器人,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁,自动索引,模拟程序或者蠕虫。



这些处理被称为网络抓取或者蜘蛛爬行。很多站点,尤其是搜索引擎,都使用爬虫提供最新的数据,它主要用于提供它访问过页面的一个副本,然后,搜索引擎就可以对得到的页面进行索引,以提供快速的访问。蜘蛛也可以在web上用来自动执行一些任务,例如检查链接,确认html代码;也可以用来抓取网页上某种特定类型信息,例如抓取电子邮件地址(通常用于垃圾邮件)。



一个网络蜘蛛就是一种机器人,或者软件代理。大体上,它从一组要访问的URL链接开始,可以称这些URL为种子。爬虫访问这些链接,它辨认出这些页面的所有超链接,然后添加到这个URL列表,可以称作检索前沿。这些URL按照一定的策略反复访问。

 

苏州达内教育优势

大项目贯穿教学  还原企业项目应用真实场景,培养项目全流程思维模式  TTS9.0学习平台  全能型TTS9.0学习平台,学练测评教AI智能全方位辅助  OMO线上线下融合  线上线下自由切换,全日制、业余班无缝衔接。讲师、服务相同  因材施教分级培优  因材施教,分级培优,针对不同基础学员,对标企业不同岗位教学  O2O双师教学模式  统一教学师资、教学质量、就业质量,同时实战老师一对一辅导  大厂级课程研发  课程内容研发引进互联网大厂项目,融入行业前沿技术

关于苏州达内IT教育

中国IT职业教育领军企业 达内时代科技集团有限公司(简称达内教育),美股交易代码:TEDU,成立于2002年。 2014年4月3日成功在美国上市,融资1亿3千万美元。成为中国赴美国上市的职业教育公司,也是引领行业的职业教育公司。 达内致力于面向IT互联网行业,培养软件开发工程师、测试工程师、系统管理员、智能硬件工程师、UI设计师、网络营销工程师、会计等职场人才。2015年起,推出面向青少年的少儿编程、智能机器人编程、编程数学等K12课程。 达内的使命:缔造年轻人的中国梦、缔造达内员工的中国梦 达内的愿景:做管理-的教育公司 开设课程 达内时代科技集团成人类课程方向:Java企业级应用软件工程师、Java互联网架构软件工程师、Java大数据工程师、Web前端开发工程师、网络运维与网络安全、Linux云计算工程师、Python 人工智能软件工程师、-嵌入式软件工程师、C++-软件工程师、PHP/web.3.0互联网工程师、-软件测试工程师、Android软件工程师、IOS软件工程师、.NET软件工程师、全链路UI设计师、商业插画、商业视觉设计课程、产品级UED交互设计师、全栈式CAD设计师、产品经理、VR开发工程师、VR次世代模型师、-网络营销师、新电商运营官、企业级影视视效、人力资源经理人课程、总账会计课程

苏州达内IT培训中心环境
以上内容是达内IT教育的小编为大家整理的“python爬虫入门常用库”相关信息。如需了解IT相关课程信息、开课时间、课程内容、相关班型等,可拨打我们咨询电话或向在线客服获取课程资料,也可在线留言或预约试听课程,我们课程顾问将会尽快联系您。为您量身定制专属课程,开启您的学习之旅。
联系我们

江苏省

苏州市沧浪区东吴北路221号惠康新地5楼
南京市秦淮区中山东路532-2号 南工院金蝶大学科技园A2栋2楼
南京市雨花台区软件大道66号华通科技园一楼105室
南京市秦淮区中山东路532-2号 南工院金蝶大学科技园A5栋2楼
无锡市新区湘江路2-3金源国际大厦A座1506
北京|上海|广州|深圳|南京|成都|武汉|西安|青岛|天津|杭州|重庆|厦门|哈尔滨|济南|福州|沈阳|合肥|郑州|长春|苏州|大连|长沙|昆明|温州|太原|南昌|无锡|石家庄|南宁|中山|兰州|佛山|珠海|宁波|贵阳|保定|呼和浩特|东莞|洛阳|潍坊|烟台|运城

 

 

免责声明:
本站内容系网友自发上传与转载,不代表本网赞同其观点;
如涉及版权等问题请及时与我们联系,将在第一时间删除处理!qq:895240345 .