问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

python项目一般要多少行代码(2023年最新分享)

发布网友 发布时间:2024-09-27 17:04

我来回答

1个回答

热心网友 时间:2024-10-01 01:09

导读:今天首席CTO笔记来给各位分享关于python项目一般要多少行代码的相关内容,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!

Python项目可以有多大

纯Python代码量最大的Sentry几乎达到了70W行,这是相当有规模的项目了。30W~50W行代码的项目有三个,包括基础项目CPython在内。

Python一般多少行代码

从我知道的信息看,用动态语言开发的最大规模的项目可能要算是OpenStack,据说代码总量已经达到数百万行,并且还在持续增加中。这当然是一个说明动态语言能力的好例子,不过像这样巨大的项目,要分析起来也并不容易。

Python设计计算程序多大算大

据说可以达到百万行,并且还在持续增加。

Python代码量最大的Sentry几乎达到了70W行,这是相当有规模的项目了。

动态语言至少在几十W行代码的项目上是完全没有问题的这也是绝大多数普通应用的上限了,如果代码真的达到数百万行规模的话,那么无论用什么语言,都势必面临着拆分项目的问题。

python的开发效率每天可以多少行

python的开发效率每天可以100-150行代码。对于一些熟练的程序员来说每天100行代码是正常的生产率,包括需求分析、设计、编码、单元测试和系统测试。

Python实现一个大数据搜索引擎需要多少行代码

十几万行吧

首先创建了一个容量为10的的布隆过滤器

然后分别加入‘dog’,‘fish’,‘cat’三个对象,这时的布隆过滤器的内容如下:

然后加入‘bird’对象,布隆过滤器的内容并没有改变,因为‘bird’和‘fish’恰好拥有相同的哈希。

最后我们检查一堆对象(’dog’,‘fish’,‘cat’,‘bird’,‘ck’,’emu’)是不是已经被索引了。结果发现‘ck’返回True,2而‘emu’返回False。因为‘ck’的哈希恰好和‘dog’是一样的。

主要分割

主要分割使用空格来分词,实际的分词逻辑中,还会有其它的分隔符。例如Splunk的缺省分割符包括以下这些,用户也可以定义自己的分割符。

](){}|!;,‘”*\n\ns\tamp;?+%21%26%2526%3B%7C%20%2B%3D—%2520%5D%5B%3A%0A%2C%28%29

搜索

好了,有个分词和布隆过滤器这两个利器的支撑后,我们就可以来实现搜索的功能了。

上代码:

Splunk代表一个拥有搜索功能的索引集合

每一个集合中包含一个布隆过滤器,一个倒排词表(字典),和一个存储所有事件的数组

当一个事件被加入到索引的时候,会做以下的逻辑

为每一个事件生成一个unqieid,这里就是序号

对事件进行分词,把每一个词加入到倒排词表,也就是每一个词对应的事件的id的映射结构,注意,一个词可能对应多个事件,所以倒排表的的值是一个Set。倒排表是绝大部分搜索引擎的核心功能。

当一个词被搜索的时候,会做以下的逻辑

检查布隆过滤器,如果为假,直接返回

检查词表,如果被搜索单词不在词表中,直接返回

在倒排表中找到所有对应的事件id,然后返回事件的内容

更复杂的搜索

更进一步,在搜索过程中,我们想用And和Or来实现更复杂的搜索逻辑。

上代码:

Python爬虫:想听榜单歌曲?只需要14行代码即可搞定

虽然说XPath比正则表达式用起来方便,但是没有最方便,只有更方便。我们的BeautifulSoup库就能做到更方便的爬取想要的东西。

使用之前,还是老规矩,先安装BeautifulSoup库,指令如下:

其中文开发文档:

BeautifulSoup库是一个强大的Python语言的XML和HTML解析库。它提供了一些简单的函数来处理导航、搜索、修改分析树等功能。

BeautifulSoup库还能自动将输入的文档转换为Unicode编码,输出文档转换为UTF-8编码。

所以,在使用BeautifulSoup库的过程中,不需要开发中考虑编码的问题,除非你解析的文档,本身就没有指定编码方式,这才需要开发中进行编码处理。

下面,我们来详细介绍BeautifulSoup库的使用规则。

下面,我们来详细介绍BeautifulSoup库的重点知识。

首先,BeautifulSoup库中一个重要的概念就是选择解释器。因为其底层依赖的全是这些解释器,我们有必要认识一下。博主专门列出了一个表格:

从上面表格观察,我们一般爬虫使用lxmlHTML解析器即可,不仅速度快,而且兼容性强大,只是需要安装C语言库这一个缺点(不能叫缺点,应该叫麻烦)。

要使用BeautifulSoup库,需要和其他库一样进行导入,但你虽然安装的是beautifulsoup4,但导入的名称并不是beautifulsoup4,而是bs4。用法如下:

运行之后,输出文本如下:

基础的用法很简单,这里不在赘述。从现在开始,我们来详细学习BeautifulSoup库的所有重要知识点,第一个就是节点选择器。

所谓节点选择器,就是直接通过节点的名称选择节点,然后再用string属性就可以得到节点内的文本,这种方式获取最快。

比如,基础用法中,我们使用h1直接获取了h1节点,然后通过h1.string即可得到它的文本。但这种用法有一个明显的缺点,就是层次复杂不适合。

所以,我们在使用节点选择器之前,需要将文档缩小。比如一个文档很多很大,但我们获取的内容只在id为blog的p中,那么我们先获取这个p,再在p内部使用节点选择器就非常合适了。

HTML示例代码:

下面的一些示例,我们还是使用这个HTML代码进行节点选择器的讲解。

这里,我们先来教会大家如何获取节点的名称属性以及内容,示例如下:

运行之后,效果如下:

一般来说一个节点的子节点有可能很多,通过上面的方式获取,只能得到第一个。如果要获取一个标签的所有子节点,这里有2种方式。先来看代码:

运行之后,效果如下:

如上面代码所示,我们有2种方式获取所有子节点,一种是通过contents属性,一种是通过children属性,2者遍历的结果都是一样的。

既然能获取直接子节点,那么获取所有子孙节点也是肯定可以的。BeautifulSoup库给我们提供了descendants属性获取子孙节点,示例如下:

运行之后,效果如下:

同样的,在实际的爬虫程序中,我们有时候也需要通过逆向查找父节点,或者查找兄弟节点。

BeautifulSoup库,给我们提供了parent属性获取父节点,同时提供了next_sibling属性获取当前节点的下一个兄弟节点,previous_sibling属性获取上一个兄弟节点。

示例代码如下:

运行之后,效果如下:

对于节点选择器,博主已经介绍了相对于文本内容较少的完全可以这么做。但实际的爬虫爬的网址都是大量的数据,开始使用节点选择器就不合适了。所以,我们要考虑通过方法选择器进行先一步的处理。

find_all()方法主要用于根据节点的名称、属性、文本内容等选择所有符合要求的节点。其完整的定义如下所示:

【实战】还是测试上面的HTML,我们获取name=a,attr={"class":"aaa"},并且文本等于text="Python板块"板块的节点。

示例代码如下所示:

运行之后,效果如下所示:

find()与find_all()仅差一个all,但结果却有2点不同:

1.find()只查找符合条件的第一个节点,而find_all()是查找符合条件的所有节点2.find()方法返回的是bs4.element.Tag对象,而find_all()返回的是bs4.element.ResultSet对象

下面,我们来查找上面HTML中的a标签,看看返回结果有何不同,示例如下:

运行之后,效果如下:

首先,我们来了解一下CSS选择器的规则:

1..classname:选取样式名为classname的节点,也就是class属性值是classname的节点2.#idname:选取id属性为idname的节点3.nodename:选取节点名为nodename的节点

一般来说,在BeautifulSoup库中,我们使用函数select()进行CSS选择器的操作。示例如下:

这里,我们选择class等于li1的节点。运行之后,效果如下:

因为,我们需要实现嵌套CSS选择器的用法,但上面的HTML不合适。这里,我们略作修改,仅仅更改

结语:以上就是首席CTO笔记为大家介绍的关于python项目一般要多少行代码的全部内容了,希望对大家有所帮助,如果你还想了解更多这方面的信息,记得收藏关注本站。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
宝宝被蜱虫叮咬后怎么办? 宝宝被蜱虫咬后该怎么办? 宝宝被蜱虫咬了,要怎么办啊? 宝宝被蜱虫咬了该怎么办? 携程旅行飞机票怎么退 携程旅行退机票手续费介绍 苹果七用ios10.0.01为什么打字 翻照片都炒鸡卡?刚刚买了几天 而且是1... 苹果7怎么老是感觉一顿一顿的 有没有人把苹果手机系统换成ios10之后,老死 QQ会员怎样成为VIP2 python读取前多少行信息(2023年最新分享) python怎么计算数据有多少行(2023年最新解答) Python最多能导入多少数据(2023年最新解答) python超过多少行难以理解(2023年最新解答) 农村医疗保险报销有时间规定吗 Python一般多少行代码(2023年最新解答) python怎么看文件有多少行(2023年最新解答) 炸鱼是什么意思 炸鱼到底是什么意思 身高177 体重260多斤 怎么减肥最好啊? 太原十大必吃美食 山西十大美食 山西十大美食介绍 哪些昆虫可以做药材 臭弟弟是什么意思臭弟弟的解释 电视棒是什么 用什么看电视 破冰之旅是什么意思? 破冰之旅这个词是什么意思 【纹身素材】纹身经典“祈祷之手” 到底是什么来头? 天欢为什么要杀蚌族 北京医保报销时间截止日期 现在的联通营业厅支持什么证件类型查询一证通查? python大文件多少行(2023年最新解答) 联通所有人都能使用"一证通查"吗? 女农历1980年8月初5生,请问2010年2月,3月搬家吉日 抽脂有什么并发症? 我是1980年农历2月16日出生的,请问2009年5月份哪天搬家是吉日? 归字的音节是什么 试管促排会不会造成内膜分离 农历1980年4月2日,姓别:女,开服装店,2009年9月27后哪一天开业有助生意兴... 升旗仪式上的作文评语怎么写? 本人是1987年1月29日(农历)出生的,我想在2014年3月开糖水店,请问有哪天... 1980年阴历8月29日属猴女和1985年阳历9月3日的属猴男2012年阴历2月份结 ... 我是农历1980年5月26出生的,想开一家冷鲜肉店,今年农历8月上旬什么时 ... 蚌埠南站进站是自动检票机吗,还是人工检票? 我有个朋友属兔,1987年农历8月15日的,现在要开个小饭店,门店朝西,请 ... 女方:1980年阴历6月29,男方1979阴历9月27,求今年2011年10月15号后我们... 《祖国在我心中》演讲稿_作文 我是1980年9月16号《阴历8月初8》出生,男。今年开鞋店,请问3月份哪... 独自去蚌埠闸水利风景区旅游是什么样的体验? 请问男属猴,1980年阴历3月3。女属虎,1986年阴历9月29。2012年哪天是吉 ...