发布网友 发布时间:2024-10-02 03:13
共1个回答
热心网友 时间:2024-11-06 02:01
导读:今天首席CTO笔记来给各位分享关于python程序最多计算多少数据的相关内容,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!
关于Python支持的最大整数是多少32位系统上是2**31-1,64位系统上是2**63-1
不过,超过这个范围后python会自动转用高精度计算,这样用户看起来就好像支持更大的整数计算。
Python设计计算程序多大算大据说可以达到百万行,并且还在持续增加。
Python代码量最大的Sentry几乎达到了70W行,这是相当有规模的项目了。
动态语言至少在几十W行代码的项目上是完全没有问题的这也是绝大多数普通应用的上限了,如果代码真的达到数百万行规模的话,那么无论用什么语言,都势必面临着拆分项目的问题。
Python列表最多可以放多少数据
一般应用场景都不用考虑这个大小,因为这个上限很高,
需要用到这么多元素的list的时候,都需要考虑很多其它问题。
1----------32位python的限制是536870912个元素。
2----------64位python的限制是1152921504606846975个元素。
python处理10亿级别数据求助还没有仔细分析你的算法。第一个感觉,如果没有一个超级计算机,还是想办法优化你的算法。
通常在python里,一个字典只有支持几万到几十万数据量的时候效率最高。字典太大并不适合这种数据类型。
列表也不是存贮效率高的一种方式,通常我们大数据量计算会使用array,最差也要使用blist。
另外range也不可以的。要用xrange。xrange通常不消耗多少内存。range会用很多内存。
你上面的文字描述也没有讲明白你的算法目标。如果你讲得清楚,可以直接帮你优化一下算法。
整型的KEY,完全可以不用字典,只需要一个索引加一个一个数组就可以解决。
总体感觉你自己把算法弄得复杂了,应该可以有更简单得多的算法。先优化算法再做程序吧。即使你用java实现这个功能,也会出现内存不足。另外你代码里可通还有语法错误。
cums1,cums2,cums3应该是一个东西,为什么要弄三份。又不需要改写。一份足够了。
powerbipython最多多少行本次统计中纯Python代码量最大的Sentry几乎达到了70W行,这是相当有规模的项目了。30W~50W行代码的项目有三个,包括基础项目CPython在内。20W和10W行代码规模的分别有三个,剩下7个则在10W行以内。
看过这个列表你应当相信,动态语言至少在几十W行代码的项目上是完全没有问题的。这也是绝大多数普通应用的上限了,如果代码真的达到数百万行规模的话,那么无论用什么语言,都势必面临着拆分项目的问题。
上表将代码量指标按照代码/空白/注释进行了分类,也在一定程度上反应了项目的代码风格。Sentry是本次统计中代码量最多的项目,然而从表中可以看到,项目中的注释和其他项目相比,少得有点不成比例,说明Sentry的作者非常不注重注释。
同学们一定发现了,我在列表中除了代码行相关的指标之外还增加了几个其他内容,这也是我个人比较感兴趣的方面。
第一个指标是每个文件的平均代码行数。按照模块化的观点,单个文件中堆砌太多内容显然是不合理的,这通常意味着耦合太多、难于理解和修改。然而到底多少算是合适,并没有一个明确的标准。我希望通过这些项目的分析,了解一下开源作者们在实践中做出的选择。
统计的结果分布比较平均,从100~600行/文件的都存在,并不存在明显的集中点。有趣的是,头两名(Pandas,NumPy)有着紧密的联系,都是和数学统计相关的。这可能是因为数学库的特点比较纯粹而单一,不像其他类库那样容易划分。末尾的项目(Pillow,youtube-dl,Odoo,Scrapy)可以从侧面印证这种猜想:它们都是面向特定领域的,所以更加容易模块化。
第二个指标是注释和代码的比例,这个问题也有着类似的情况。注释并非越详尽越好,但总是需要一定量的注释来解释Why的问题。注释太少,说明项目的作者没有给后来的维护人员留下足够的线索,可能会造成维护上的问题。另一方面,我们考察的全部是开源项目,没有公司考核或者KPI的约束,所以我们可以放心的相信不会存在作者故意多写注释的问题。
前面提到的Sentry毫无争议的因为注释太少排到了最后,这未必说明这个项目很差,但至少是一个信号,说明该项目在维护方面可能是存在问题的。而对于那些作者愿意投入精力来写注释的项目(Ansible,NumPy,Fabric,Salt等),足以反映作者在项目上投入了相当大的心力,这是一个好的信号,说明这些项目是值得信赖的。
有一点是出乎我意料的,那就是作为所有项目之母的CPython排名比较靠后,按照道理这个基础项目应该有更多的注释才对。不过再想一想又觉得可以理解,因为CPython有单独发布的、非常详尽的文档,这是其他大多数项目都没有的,那么代码中的注释少一些也是情有可原的。
最后一项统计是关于文件类型的。Python项目中绝大多数应该是Python代码,这点没有什么疑问,但同时我也想看看除了Python代码之外,一个项目还包括哪些主要文件。C/HTML/Javascipt的上榜是毫不意外的,但有一种文件我事先没有想到,那就是.PO(开源项目常用的语言资源文件)。
对于Django和Django-CMS这两个项目,PO代码数量甚至比Python代码还要多。大概看了一下,Django支持90种以上的语言,这也无怪乎语言文件的数量如此之多了。
这个结果也可以提醒我们,有些同学——不仅是程序员,也包括大多数经验不足的老板、客户、产品经理等——会下意识的认为程序开发无非是写代码,对于代码之外的其他工作,在估算的时候往往只拍脑袋式的定下一个极短的时间。但对于实际的项目来说,代码仅仅是其中的一部分,“其他工作”有时候——应该说是经常——会占用你大部分的的时间和精力。这些工作往往并不有趣,但对于项目来说又是必不可少的组成部分,希望同学们予以足够的重视。
结语:以上就是首席CTO笔记为大家整理的关于python程序最多计算多少数据的相关内容解答汇总了,希望对您有所帮助!如果解决了您的问题欢迎分享给更多关注此问题的朋友喔~