欢迎来到天天培训网!全国[切换城市] 登录 注册
首页 发布课程 机构平台 手机浏览

手机扫一扫

咨询热线

400-0808-102

怎么用python写爬虫

天天培训网络中心   2022-11-23 阅读:86
怎么用python写爬虫

 


Django 是由 Python 开发的一个免费的开源网站框架,可以用于快速搭建高性能,优雅的网站!以下是小编为你整理的怎么用python写爬虫



1. Django是 python 语言写的一个网络框架包,所以你得知道一些 Python 基础知识。



2. 其次你最好有一些做网站的经验,懂一些网页 HTML, CSS, JAVAScript 的知识。



没有经验也没有关系,慢慢来就好了,你一定可以学会,Django 很简单!



Django 特点



强大的数据库功能



怎么用python写爬虫



用python的类继承,几行代码就可以拥有一个丰富,动态的数据库操作接口(API),如果需要你也能执行SQL语句



自带的强大的后台功能



几行简单的代码就让你的网站拥有一个强大的后台,轻松管理你的内容!



优雅的网址



用正则匹配网址,传递到对应函数,随意定义,如你所想!



模板系统



强大,易扩展的模板系统,设计简易,代码,样式分开设计,更容易管理。



缓存系统



与memcached或其它的缓存系统联用,更出色的表现,更快的加载速度。



国际化



完全支持多语言应用,允许你定义翻译的字符,轻松翻译成不同国家的语言。


函数式编程


允许变量指向函数,直接对变量的调用和调用这个函数是一样的效果;



接收参数是函数的函数,同时也称高阶函数。



例子:利用add(x,y,f)函数,计算:x,y的平方根之和:



import math



def add(x,y,f):



return f(x)+f(y)



add(9,25,math.sqrt)



END



map()高阶函数



1



a)、map()函数:接收一个f函数以及一个list,并且通过f函数依次作用在list的每一个元素上返回一个新的list。



b)、使用:map(function,list)



c)、例子:



假设用户输入的英文名字不规范,没有按照首字母大写,后续字母小写的规则,请利用map()函数,把一个list(包含若干不规范的英文名字)变成一个包含规范英文名字的list:



输入:["adam", "LISA", "barT"]



输出:["Adam", "Lisa", "Bart"]



def format_name(l):



return l[0:1].upper()+l[1:].lower()



print map(format_name,["adam", "LISA", "barT"])



reduce()高阶函数



a)、reduce()函数:允许接收一个函数f和一个list;而reduce()传入的函数f必须接收两个参数。reduce对list中的每一个元素反复调用函数f并返回结果,然后将结果作为新的参数传入函数f .



b)、调用:reduce(function,list)



c)、例子:Python内置了求和函数sum(),但没有求积的函数,请利用recude()来求积:



输入:[2, 4, 5, 7, 12]



输出:2*4*5*7*12的结果



def prod(x,y):



return x*y



print reduce(prod,[2,4,5,7,12])



END



filter()高阶函数



1



a)、filter():接收一个函数f和list。函数f对list中的每一个元素进行过滤,返回true or false,filter()函数根据判断结果自动过滤不符合条件的元素,返回符合条件的元素组成新的list。



b)、调用:filter(function,list)



c)、例子:请利用filter()过滤出1~100中平方根是整数的数,即结果应该是:



[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]



import math



def is_sqr(l):



s=math.sqrt(l)



return int(s)==s



print filter(is_sqr,range(1,101))



print函数



我们在使用print()函数的时候如果在参数前面加上r,那么后面字符串里的内容就原封不动地打印出来啦。



>>> print(r"n ")



n



>>> print("n ")



SyntaxError: EOL while scanning string literal



>>> print("n ")


 



>>> print("n ")






你知道为什么输入print("n ")报错;而输入print("n ")可以正常运行吗?因为后面得接些转义字符。



如果我们想让每个单词单独输出一行怎么办呢?
虽然是一种方法,但是让代码很难看。



在print()里,用""" """将要输出显示的内容包起来,引号里的
符就可以打印出来啦,方便直观。



当然前面加上r也是有同样效果的,下次看到不要惊奇。



python里的变量是区分大小写的,前面我们已经介绍过来,再来通过布尔值来验证一下。





>>> true



Traceback (most recent call last):



File "", line 1, in



true



NameError: name "true" is not defined



>>> True



True



导入Numpy模块



import Numpy as np



先输入数组



>>> a= np.arange(10)



>>> a



array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])



进行切片



>>> a[5]#用整数作为下标可以获得数组中的某个元素



>>> a[3:5]#用切片作为下标可以获得数组的一部分元素,注意包括首位,但不包含尾部



array([3, 4])



>>> a[:5]#切片中省略开始下标,表示从a[0]开始到a[5]结束,但不包含a[5]



array([0, 1, 2, 3, 4])



>>> a[:-1]#下标可以是负数,数组倒数第一位为-1,a[:-1]表示从第一位一直取到-1的位置,但不包括-1位的数据



array([0, 1, 2, 3, 4, 5, 6, 7, 8])



>>> a[2:4]=100,101#可以通过数组下标赋值来改变数组中数据



>>> a



array([ 0, 1, 100, 101, 4, 5, 6, 7, 8, 9])



>>> a[1:-1:2]#从数组下标1取到-1位置,且步长为2,且不包含-1位置数据



array([ 1, 101, 5, 7])



>>> a[::-1]#省略切片的开始下标和结束下标,步长为-1,表示整个数组头尾颠倒



array([ 9, 8, 7, 6, 5, 4, 101, 100, 1, 0])



>>> a[5:1:-2]#起始点为a[5],终点位置为a[1],且不包含a[1],步长为-2指倒着数



array([ 5, 101])



>>> x=np.arange(10,1,-1)#arange函数类似于列表操作,从10倒数取到1,步长为-1



>>> x



array([10, 9, 8, 7, 6, 5, 4, 3, 2])

 

苏州达内教育优势

技术特点
课程内容涵盖当前炙手可热的容器化Docker与SpringCloud微服务,二者结合是技术发展的必然趋势,更是程序员跳槽、涨薪利器!
系统特点
课程的设置目标明确,旨在加速程序员进阶架构师,因此课程内容围绕这一目标,层层推进,既有广度又有深度!
快速掌握技术
深入企业调研,洞悉前沿技术发展趋势,凝聚更主流的技术,锤炼更深入的原理,仅需15天,提升程序员的研发实力!
理论实操结合
课程不仅有框架的应用,而且还有底层源码,并且深度挖掘技术原理,既有理论高度,又能落地实施,因此深刻!

关于苏州达内IT教育

中国IT职业教育领军企业 达内时代科技集团有限公司(简称达内教育),美股交易代码:TEDU,成立于2002年。 2014年4月3日成功在美国上市,融资1亿3千万美元。成为中国赴美国上市的职业教育公司,也是引领行业的职业教育公司。 达内致力于面向IT互联网行业,培养软件开发工程师、测试工程师、系统管理员、智能硬件工程师、UI设计师、网络营销工程师、会计等职场人才。2015年起,推出面向青少年的少儿编程、智能机器人编程、编程数学等K12课程。 达内的使命:缔造年轻人的中国梦、缔造达内员工的中国梦 达内的愿景:做管理-的教育公司 开设课程 达内时代科技集团成人类课程方向:Java企业级应用软件工程师、Java互联网架构软件工程师、Java大数据工程师、Web前端开发工程师、网络运维与网络安全、Linux云计算工程师、Python 人工智能软件工程师、-嵌入式软件工程师、C++-软件工程师、PHP/web.3.0互联网工程师、-软件测试工程师、Android软件工程师、IOS软件工程师、.NET软件工程师、全链路UI设计师、商业插画、商业视觉设计课程、产品级UED交互设计师、全栈式CAD设计师、产品经理、VR开发工程师、VR次世代模型师、-网络营销师、新电商运营官、企业级影视视效、人力资源经理人课程、总账会计课程

苏州达内IT培训中心环境
以上内容是达内IT教育的小编为大家整理的“怎么用python写爬虫”相关信息。如需了解IT相关课程信息、开课时间、课程内容、相关班型等,可拨打我们咨询电话或向在线客服获取课程资料,也可在线留言或预约试听课程,我们课程顾问将会尽快联系您。为您量身定制专属课程,开启您的学习之旅。
联系我们

江苏省

苏州市沧浪区东吴北路221号惠康新地5楼
南京市秦淮区中山东路532-2号 南工院金蝶大学科技园A2栋2楼
南京市雨花台区软件大道66号华通科技园一楼105室
南京市秦淮区中山东路532-2号 南工院金蝶大学科技园A5栋2楼
无锡市新区湘江路2-3金源国际大厦A座1506
北京|上海|广州|深圳|南京|成都|武汉|西安|青岛|天津|杭州|重庆|厦门|哈尔滨|济南|福州|沈阳|合肥|郑州|长春|苏州|大连|长沙|昆明|温州|太原|南昌|无锡|石家庄|南宁|中山|兰州|佛山|珠海|宁波|贵阳|保定|呼和浩特|东莞|洛阳|潍坊|烟台|运城

 

 

免责声明:
本站内容系网友自发上传与转载,不代表本网赞同其观点;
如涉及版权等问题请及时与我们联系,将在第一时间删除处理!qq:895240345 .