Analysis and creation of free sentiment analysis programs / Josip Mihaljević.
Sažetak

This paper analyzes free online programs for sentiment analysis which can, on the bases of their algorithm, give a positive, negative or neutral opinion of a text. At the beginning of the paper sentiment analysis programs and techniques they use such as Naive Bayes and Recurrent Neural Networks are presented. The programs are divided into two categories for analysis. The fi rst category consists of sentiment analysis programs which analyze texts written or copied inside the user interface. The second category consists of programs for analyzing opinions posted on social networks, blogs, and other media sites. Programs from both categories were chosen for this research on the bases of positive reviews on computer science portals and their popularity on web search engin es such as Google and Bing. The accuracy of the programs from the fi rst category was checked by inserting the same sentence from movie reviews and comparing the results. Their additional options have also been analyzed. For the second category of programs, it was determined which social networks, blogs, and other social media they cover on the internet. The purpose of this analysis was to check the overall quality and options that free sentiment analysis programs provide. An example of how to create one’s own custom sentiment analyzer by using the available Python code and libraries found online is also given. Two simple programs were created using Python. The fi rst program belongs to the fi rst category of programs for analyzing an input text. This program serves as a pilot program for Croatian which gives only the basic analysis of sentences. The second program collects recent tweets from Twitter containing certain words and creates a pie chart based on the analysis of the results.; U radu se analiziraju besplatni računalni programi za analizu sentimenta (mišljenja, osjećaja, stava) koji mogu izraziti pozitivan, neutralan ili negativan stav o sadržaju teksta na temelju određenih kriterija unutar algoritma. Na početku rada objašnjava se što su programi za analizu sentimenta, kojim se tehnikama koriste te se iscrpno objašnjavaju dosadašnja istraživanja. Analiziraju se dvije skupine besplatnih mrežnih programa. Jedna skupina programa služi za analizu sadržaja napisanoga ili kopiranoga teksta, a druga za analizu sentimenta objava na društvenim mrežama, blogovima ili kojemu drugom obavještajnom tipu mrežnih stranica. Programi iz obiju skupina odabrani su na temelju recenzija s informatičkih portala te popularnosti na mrežnim tražilicama poput Googlea i Binga. Za prvu skupinu programa analizirane su tehnike koje se koriste za analizu teksta, dodatne mogućnosti koje se mogu koristiti tijekom analize teksta te se pokazuje koju procjenu sentimenta programi daju za odabrani dio teksta iz recenzije i koliko ga precizno analiziraju. Za drugu skupinu programa analizira se koje društvene mreže, blogove te ostale tipove obavještajnih stranica obuhvaćaju te na koji način prikazuju rezultate obrađene analizom. Iz analize obiju skupina programa dolazi se do zaključka o mogućnostima njihova korištenja te kvaliteti usluga. Također se prikazuje kako se može izraditi vlastiti program za analizu sentimenta s pomoću mrežno dostupnih kodova i dodataka za programski jezik Python. Na temelju tih dostupnih resursa napravljena su dva program od kojih prvi služi kao demoinačica za hrvatski jezik te daje informacije o stavu vezanom za upisani tekst, a drugi program dohvaća posljednje tweetove koji sadržavaju određenu riječ te izrađuje grafi kon koji prikazuje stavove u tweetovima koji sadržavaju tu riječ.