python代码重复率怎么查

答：使用open函数逐行读取文件，依次对比，如包含要求字符串，则数量累加1，读取完成后可统计出行数，代码如下：
n = 0
for line in open('filename','r'):
if '固定字符串' in line:
n += 1
print(n)
说明：
使用 for line in open这种方式可以提高代码效率，如需要更复杂统计，例如重复行，则可以使用hash函数，把行hash值存入列表，再做统计。
答：100万条，还是不是很大。建议用C语言。把100万条加载到内存里，然后字符串依次比较，也是很快的。具体是先read到内存里，然后把每个回车统计一下，建立一个行首字符的索引。
正常的做法是做索引的。在生成记录时，自动将关键词索引造出来。查询时，只查询索引就可以了。
这样，即使是几千万条记录，查询也是很快。1，2，3就是一个关键词。
答：文件过大，考虑数据库。当作字符处理很占内存的。
1、str.count
2、你可以用sqlite来加载这个文件。用select的方式去查总数
答：CONDSTR = '1,2,3'
def match(ln, condstr=CONDSTR):
''' 指定的串是否在行中 '''
return condstr in ln
cnt = 0
with open(thesrcfile, 'rt') as handle:
for ln in handle:
if match(ln):
cnt += 1

猜你喜欢