Analiza częstości liter
WPROWADZENIE
Czy kiedykolwiek zastanawiałeś się, które litery w języku polskim są najczęściej używane? A może chcesz sprawdzić, czy Twój ulubiony autor ma swój unikalny „alfabetyczny odcisk palca”? Dzięki prostemu programowi w języku Python możesz w kilka sekund przeanalizować dowolny tekst, zobaczyć wyniki w czytelnej formie i wyeksportować je do dalszej analizy.
Nasz program to narzędzie idealne dla uczniów, studentów, analityków danych, a także dla każdego, kto jest po prostu ciekawy języka. Wystarczy wkleić dowolny fragment tekstu – od krótkiego zdania po całą powieść – a program zajmie się resztą.
Zasada działania
Na początku program prosi użytkownika o wpisanie tekstu. Jego długość jest ograniczona tylko pamięcią RAM, więc może być baaarrrdzo długi 🤩
Po wprowadzeniu tekstu trzeba jeszcze zdecydować, czy wyniki mają być wyeksportowane do pliku CSV, a następnie narzędzie przystępuje do pracy. Wyniki prezentowane są na trzy sposoby, aby dać Ci pełny obraz analizowanego materiału:
- Szczegółowa tabela: W konsoli wyświetlona zostaje przejrzysta tabela, która pokazuje, ile razy każda litera polskiego alfabetu (od „a” do „ż”) pojawiła się w Twoim tekście.
- Wykres graficzny: Program generuje czytelny diagram kolumnowy. Na osi poziomej znajdują się wszystkie litery alfabetu, a wysokość słupków odpowiada liczbie ich wystąpień. Dzięki temu możesz błyskawicznie zorientować się, które litery dominują w tekście.
- Eksport do pliku CSV: Jeśli chcesz zachować wyniki na później lub przeprowadzić bardziej zaawansowaną analizę, program oferuje opcję eksportu danych do pliku CSV. Taki plik można łatwo otworzyć w dowolnym arkuszu kalkulacyjnym, takim jak Microsoft Excel czy Google Sheets.
To proste, ale potężne narzędzie otwiera drzwi do fascynującego świata analizy tekstu i pokazuje, jak wiele informacji można wydobyć ze zwykłych słów.
Poniżej znajduje się kod w języku Python:
KOD W JĘZYKU PYTHON
JAK DZIAŁA PROGRAM?
Działanie programu można opisać w kilku prostych krokach, które wykonuje on po uruchomieniu.
- Krok 1: Przygotowanie i pobranie danych Na samym początku program przygotowuje sobie listę wszystkich liter polskiego alfabetu. Następnie prosi użytkownika o wpisanie tekstu do analizy oraz o podjęcie decyzji, czy finalne wyniki mają zostać zapisane do pliku.
- Krok 2: Analiza tekstu Program przechodzi przez cały wprowadzony tekst, znak po znaku. Każdą napotkaną literę (ignorując jej wielkość) zlicza, dodając jeden do odpowiedniego licznika przypisanego do tej litery.
- Krok 3: Prezentacja wyników w tabeli Po zakończeniu zliczania program wyświetla w konsoli czytelną tabelę, w której obok każdej litery alfabetu znajduje się liczba jej wystąpień w tekście.
- Krok 4: Wizualizacja danych Korzystając ze zebranych danych, program tworzy diagram kolumnowy. Na wykresie umieszczone są wszystkie litery alfabetu, a wysokość słupków odzwierciedla ich policzoną częstotliwość.
- Krok 5: Eksport do pliku (opcjonalnie) Jeśli na początku użytkownik wyraził taką chęć, program tworzy plik w formacie CSV. Zapisuje w nim dane o liczbie wystąpień poszczególnych liter oraz, dla kontekstu, oryginalny tekst, który był analizowany. Na końcu informuje użytkownika o pomyślnym zapisaniu pliku.