arrow_back Powrót do aplikacji

Analiza częstości liter

WPROWADZENIE

Czy kiedykolwiek zastanawiałeś się, które litery w języku polskim są najczęściej używane? A może chcesz sprawdzić, czy Twój ulubiony autor ma swój unikalny „alfabetyczny odcisk palca”? Dzięki prostemu programowi w języku Python możesz w kilka sekund przeanalizować dowolny tekst, zobaczyć wyniki w czytelnej formie i wyeksportować je do dalszej analizy.

Nasz program to narzędzie idealne dla uczniów, studentów, analityków danych, a także dla każdego, kto jest po prostu ciekawy języka. Wystarczy wkleić dowolny fragment tekstu – od krótkiego zdania po całą powieść – a program zajmie się resztą.

Zasada działania

Na początku program prosi użytkownika o wpisanie tekstu. Jego długość jest ograniczona tylko pamięcią RAM, więc może być baaarrrdzo długi 🤩

Po wprowadzeniu tekstu trzeba jeszcze zdecydować, czy wyniki mają być wyeksportowane do pliku CSV, a następnie narzędzie przystępuje do pracy. Wyniki prezentowane są na trzy sposoby, aby dać Ci pełny obraz analizowanego materiału:

  1. Szczegółowa tabela: W konsoli wyświetlona zostaje przejrzysta tabela, która pokazuje, ile razy każda litera polskiego alfabetu (od „a” do „ż”) pojawiła się w Twoim tekście.
  2. Wykres graficzny: Program generuje czytelny diagram kolumnowy. Na osi poziomej znajdują się wszystkie litery alfabetu, a wysokość słupków odpowiada liczbie ich wystąpień. Dzięki temu możesz błyskawicznie zorientować się, które litery dominują w tekście.
  3. Eksport do pliku CSV: Jeśli chcesz zachować wyniki na później lub przeprowadzić bardziej zaawansowaną analizę, program oferuje opcję eksportu danych do pliku CSV. Taki plik można łatwo otworzyć w dowolnym arkuszu kalkulacyjnym, takim jak Microsoft Excel czy Google Sheets.

To proste, ale potężne narzędzie otwiera drzwi do fascynującego świata analizy tekstu i pokazuje, jak wiele informacji można wydobyć ze zwykłych słów.

Poniżej znajduje się kod w języku Python:


KOD W JĘZYKU PYTHON

Zobacz w Google Colaboratory


JAK DZIAŁA PROGRAM?

Działanie programu można opisać w kilku prostych krokach, które wykonuje on po uruchomieniu.

  • Krok 1: Przygotowanie i pobranie danych Na samym początku program przygotowuje sobie listę wszystkich liter polskiego alfabetu. Następnie prosi użytkownika o wpisanie tekstu do analizy oraz o podjęcie decyzji, czy finalne wyniki mają zostać zapisane do pliku.
  • Krok 2: Analiza tekstu Program przechodzi przez cały wprowadzony tekst, znak po znaku. Każdą napotkaną literę (ignorując jej wielkość) zlicza, dodając jeden do odpowiedniego licznika przypisanego do tej litery.
  • Krok 3: Prezentacja wyników w tabeli Po zakończeniu zliczania program wyświetla w konsoli czytelną tabelę, w której obok każdej litery alfabetu znajduje się liczba jej wystąpień w tekście.
  • Krok 4: Wizualizacja danych Korzystając ze zebranych danych, program tworzy diagram kolumnowy. Na wykresie umieszczone są wszystkie litery alfabetu, a wysokość słupków odzwierciedla ich policzoną częstotliwość.
  • Krok 5: Eksport do pliku (opcjonalnie) Jeśli na początku użytkownik wyraził taką chęć, program tworzy plik w formacie CSV. Zapisuje w nim dane o liczbie wystąpień poszczególnych liter oraz, dla kontekstu, oryginalny tekst, który był analizowany. Na końcu informuje użytkownika o pomyślnym zapisaniu pliku.
arrow_back Powrót do aplikacji