Commit 528a33c1 authored by cermak's avatar cermak
Browse files

fix

parent e96b33a1
Pipeline #20209 passed with stage
in 34 seconds
#!/usr/bin/env python3
# Spočítá frekvence k-gramů v souboru soubor.txt
# (v každém řádku zvlášť).
from collections import defaultdict
k=3
kgramy=defaultdict(int)
for radek in open('soubor.txt'):
# Rozdělíme na k-gramy
# (ignorujeme znak konce řádku na poslední pozici)
for i in range(len(radek)-k):
kgramy[radek[i:i+k]] += 1
# Vytvoříme seznam dvojic (frekvence, k-gram), vypíšeme seřazeně
vystup = [ (f, g) for g, f in kgramy.items() ]
for f, g in reversed(sorted(vystup)):
print(f, g)
#!/usr/bin/env python3
# Spočítá frekvence k-gramů v souboru soubor.txt
# (uvažujeme i k-gramy jdoucí přes hranice řádků).
from collections import defaultdict
k=3
text = ""
for radek in open('soubor.txt'):
text += radek[:-1] + ' '
kgramy=defaultdict(int)
for i in range(len(text)-k):
kgramy[text[i:i+k]] += 1
# Vytvoříme seznam dvojic (frekvence, k-gram), vypíšeme seřazeně
vystup = [ (f, g) for g, f in kgramy.items() ]
for f, g in reversed(sorted(vystup)):
print(f, g)
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment