W związku z utworzeniem Zakładu Sztucznej Inteligencji od 1 stycznia 2020 seminarium Zakładu Przetwarzania Języka Naturalnego przekształciło się w Seminarium Modelowania Języka i Analizy Dyskursu. Informacje dotyczące programu nowego seminarium można znaleźć pod adresem ai.wmi.amu.edu.pl/seminars/lmda
Poniżej lista referatów przedstawionych na seminarium Pracowni Systemów Informacyjnych i Zakładu Przetwarzania Języka Naturalnego w latach 2016-2019.
17.12.2019
Weronika Sieińska (Heriot-Watt University)
Alana – an Entertaining and Informative Open-domain Social Chatbot
10.12.2019
Michał Głazik
Mnemotechniczne przedstawianie danych w języku polskim
03.12.2019
Robert Kwieciński
Introduction to recommender systems
19.11.2019
Dawid Jurkiewicz
Semantic similarity retrieval by analogy
05.11.2019
Karol Kaczmarek
World of Transformer (prezentacja)
29.10.2019
Wojciech Włodarczyk
Sprawdzamy, jak jest – crowdsourcing obywatelski
22.10.2019
Karolina Boczoń
Tokenizacja języków nieposiadających określonych granic wyrazów
08.10.2019
Jakub Pokrywka
Paper review: Massively Multilingual Sentence Embeddings for Zero-Shot Cross-Lingual Transfer and Beyond, Cross-lingual Language Model Pretraining (prezentacja)
24.09.2019
Filip Graliński
GEval – narzędzie do ewaluacji i diagnostyki „black-box” modeli uczenia maszynowego
10.09.2019
Waldemar Jęśko (PCSS)
Image recognition: logo recognition
03.09.2019
Filip Graliński
Teoria dziwności
27.08.2019
Magdalena Mozgawa
Międzynarodowy alfabet fonetyczny. Elementy fonetyki języka angielskiego
06.08.2019
Jakub Pokrywka
Podsumowanie konferencji SIGIR 2019
23.07.2019
Marcin Sikora
Data Augmentation Techniques for Automatic Speech Recognition
16.07.2019
Poznańskie Centrum Superkomputerowo-Sieciowe
09.07.2019
Roman Grundkiewicz (University of Edinburgh)
Recent advances in grammatical error correction
02.07.2019
Jolanta Bachan
A set of tools for analysis of speech fundamental frequency
25.06.2019
Aleksander Mendoza-Drosik
Metody formalne
18.06.2019
Robert Kwieciński (OLX)
Systemy rekomendacyjne dla serwisów ogłoszeniowych
18.06.2019
Michał Junczyk (Samsung)
Rozwiązania open source w obszarze nienadzorowanej produkcji danych mowy do treningu systemów ASR
11.06.2019
Piotr Radwan
Regułowe uczenie maszynowe
O metodach inferencji gramatyk
04.06.2019
Karolina Boczoń
Gramatyki kategorialne
28.05.2019
Krzysztof Jurkiewicz
Uczenie maszynowe
14.05.2019
Jakub Pokrywka
Redukcja wymiarowości: PCA, SNE, t-SNE, UMAP
07.05.2019
Krzysztof Jurkiewicz
Paper review: Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift, Batch Renormalization: Towards Reducing Minibatch Dependence in Batch-Normalized Models
16.04.2019
Rafał Jaworski
Concordia i Copycat – przeszukiwanie korpusów tekstów
09.04.2019
Tomasz Ziętkiewicz
Open Challenge for Correcting Errors of Speech Recognition Systems. Recent Advances in Error Correction of ASR
02.04.2019
Paweł Skórzewski
Using book dialogs to extract emotions from texts in Polish
19.03.2019
Jakub Pokrywka
NLP w wyszukiwarce e-commerce
12.03.2019
Karol Kaczmarek
Historia zakazanego modelu
05.03.2019
Dawid Jurkiewicz
Podobieństwo dokumentów
26.02.2019
Wojciech Włodarczyk
Nauczanie maszynowe
19.02.2019
Tomasz Ziętkiewicz
O algorytmach poprawy błędów w wynikach rozpoznawania mowy
12.02.2019
Tomasz Dwojak
Backtranslation: tworzenie dodatkowych danych do trenowania modeli NMT
29.01.2019
Tomasz Dwojak
Style transfer
Style transfer jest zadaniem, które polega na zmianie „stylu” tekstu (np. formalności lub grzeczności). Podczas prezentacji opowiem o moich badaniach i wynikach na ten temat, które prowadziłem podczas stażu w Grammarly.
15.01.2019
Weronika Sieińska
MovieDial – system dialogowy oparty na zestawie narzędzi PyDial
08.01.2019
Dawid Jurkiewicz
Paper review: On the Dimensionality of Word Embedding
11.12.2018
Tomasz Górecki
Metody badania współliniowości cech
04.12.2018
Karol Kaczmarek
Paper review: Focused Hierarchical RNNs for Conditional Sequence Processing
27.11.2018
Paweł Skórzewski
Analiza wydźwięku w oparciu o teorię emocji Plutchika
20.11.2018
Krzysztof Jassem
Dedykowane tłumaczenie automatyczne
30.10.2018
Jolanta Bachan
Badania lingwistyczne na korpusach mowy
23.10.2018
Łukasz Borchmann (Instytut Językoznawstwa UAM)
Approaching nested named entity recognition with parallel LSTM-CRFs
16.10.2018
Weronika Sieińska
Wyzwania motywujące głębokie uczenie maszynowe – przekleństwo wymiarowości
09.10.2018
Paweł Skórzewski
7th Dialog System Technology Challenge: Noetic End-to-End Response Selection
02.10.2018
Krzysztof Jassem
Probabilistic spell-checking
25.09.2018
Filip Graliński
Black-box debugging for Machine Learning models
18.09.2018
Rafał Szczukiewicz
Charakterystyka fonetyczna języka francuskiego
04.09.2018
Agnieszka Wagner
Stability of temporal patterns and rhythmic classification of Polish utterances: Towards a comprehensive definition of rhythm
28.08.2018
Karol Kaczmarek
Unsupervised learning methods based on huge data for the needs of supervised learning methods using small training sets – introduction
21.08.2018
Krzysztof Jurkiewicz
Challenges in neural network optimizations
14.08.2018
Piotr Radwan
Wyrażenia regularne i tłumaczenie gramatyk
31.07.2018
Krzysztof Jassem
Modele języka
17.07.2018
Adam Cankudis (TeamLeaders)
System wspomagający organizacje w kontaktach z klientem z wykorzystaniem IBM Watson Explorer
10.07.2018
Łukasz Borchmann (Instytut Językoznawstwa UAM)
A corpus-driven method of determining languages relatedness and (pre)history of their speakers
03.07.2018
Mieszko Wrzeszczyński
Paper review: How important is a neuron?
26.06.2018
Wojciech Włodarczyk
SpaceTag – wyniki badania pilotażowego
19.06.2018
Piotr Dura
On uncertainty in deep learning models
12.06.2018
Marek Kubis
Analiza sieci społecznych pozyskiwanych automatycznie z utworów literackich: dialogowanie, punkty artykulacji, centralność
05.06.2018
Marcin Sikora
Wykorzystanie sygnału wielokanałowego od podniesienia jakości automatycznego rozpoznawania mowy
29.05.2018
Tomasz Ziętkiewicz
Data driven text normalization
22.05.2018
Paweł Skórzewski
7th Dialog System Technology Challenge
15.05.2018
Agnieszka Ławrynowicz (Instytut Informatyki Politechniki Poznańskiej)
Translacja pytań kompetencyjnych w języku naturalnym do języka zapytań SPARQL-OWL
Ontologie są formalnymi specyfikacjami wiedzy terminologicznej i obecnie są coraz częściej wykorzystywane do integracji, opisu i organizacji danych i wiedzy, w zastosowaniach zarówno badawczych jak i przemysłowych. Jedną z części procesu tworzenia ontologii jest zapewnienie ich jakości, w tym wymaganego pokrycia modelowanego obszaru wiedzy. Wiele z metodyk inżynierii ontologii zawiera etap formułowania pytań kompetencyjnych, na które ontologia bądź też system informacyjny zbudowany w oparciu o nią powinne być w stanie udzielić odpowiedzi, tj. zawierać odpowiednie słownictwo jak i aksjomaty. Pytania kompetencyjne są wyrażone w języku naturalnym. Na kolejnych etapach tworzenia ontologii, pytania są manualnie formalizowane do języka zapytań ontologii i/lub baz wiedzy (najczęściej SPARQL), co jest żmudnym procesem, wymagającym znajomości formalnych języków modelowania. W prezentacji omówię zagadnienia automatycznej bądź też półautomatycznej translacji pytań kompetencyjnych do dialektu języka SPARQL.
08.05.2018
Mikołaj Sobkowiak
Koncepcja modelu pisanego języka duńskiego polskich studentów
24.04.2018
Tomasz Dwojak
Sieci konwolucyjne w przetwarzaniu obrazu i tekstu
17.04.2018
Weronika Sieińska
Paper review: Dialog System & Technology Challenge 6 Overview of Track 1 – End-to-End Goal-Oriented Dialog learning
10.04.2018
Piotr Dura
Paper review: Deep-FSMN for Large Vocabulary Continuous Speech Recognition
20.03.2018
Rafał Jaworski
Multisłownik – integracja polskich źródeł słownikowych
13.03.2018
Michał Głazik
Omówienie wybranych artykułów z Interspeech 2017 dotyczących nowoczesnych rozwiązań w rozpoznawaniu mowy
06.03.2018
Dawid Jurkiewicz
Wielojęzyczne zanurzenia słów bez użycia korpusu równoległego
27.02.2018
Agnieszka Kaliska (Instytut Filologii Romańskiej UAM)
Zastosowanie słowosieci w analizie leksykologicznej polskich i francuskich nazw technik wędkarskich
13.02.2018
Filip Graliński
“Diaeq” — diachronic equivalents as a challenge for machines
06.02.2018
Wojciech Włodarczyk
SpaceTag – zgrywalizowany system do zbierania danych lingwistycznych
23.01.2018
Roman Grundkiewicz
An exploration of neural sequence-to-sequence architectures for automatic post-editing
16.01.2018
Tomasz Dwojak
Marian z Poznania, czyli zestaw narzędzi do NMT
05.12.2017
Filip Graliński
Extracting spelling variant and temporal equivalents from raw diachronic corpora
28.11.2017
Paweł Skórzewski
Processing historical texts with contemporary NLP tools
21.11.2017
Krzysztof Jassem
Prezentacja systemu testów na zajęciach dydaktycznych
14.11.2017
Tomasz Dwojak
SUMMA – Scalable Understanding of Multilingual Media
24.10.2017
Rafał Jaworski
CLARIN – Common Language Resources and Technology Infrastructure
10.10.2017
Tomasz Ziętkiewicz
A knowledge-grounded neural conversation model
03.10.2017
Marek Kubis
SemEval-2017 – przegląd
26.09.2017
Mateusz Flieger
Głębokie uczenie ze wzmocnieniem
19.09.2017
Weronika Sieińska
Zastosowanie uczenia przez wzmacnianie do zarządzania dialogiem
12.09.2017
Roman Grundkiewicz
Grammatical error correction with machine translation
29.08.2017
Dawid Jurkiewicz
Distant Supervision
Podczas wystąpienia zostanie przedstawiony paradygmat Distant Supervision oraz proces ekstrakcji relacji na nim oparty.
22.08.2017
Piotr Radwan
Sieci neuronowe w ujęciu paradygmatu funkcyjnego
08.08.2017
Michał Głazik
Rekurencyjne sieci neuronowe typu LSTM
01.08.2017
Mieszko Wrzeszczyński
Algorytm wizualizacji danych t-SNE
25.07.2017
Piotr Dura
SEGAN – Speech Enhancement Generative Adversarial Network
18.07.2017
Jakub Pokrywka
Odszumianie sygnału przy pomocy funkcji o ograniczonym wahaniu
Prezentacja będzie na podstawie mojej pracy magisterskiej z matematyki „O pewnych zastosowaniach funkcji o ograniczonej wariacji”. Będę prezentował algorytm służący do odszumiania sygnału jednowymiarowego i sposób dojścia do niego przy wykorzystaniu funkcji o ograniczonym wahaniu.
27.06.2017
Łukasz Borchmann (Instytut Językoznawstwa UAM)
Od materiału drukowanego do elektronicznego słownika demonstracyjnego – historia Narodowego Fotokorpusu Języka Polskiego oraz pokrewnych projektów dla języka wietnamskiego i koreańskiego
13.06.2017
Paweł Skórzewski
PSI-Toolkit – rewolucje
Wzbogacenie PSI-Toolkitu o narzędzia do normalizacji diachronicznej
06.06.2017
Wojciech Włodarczyk
Ocena jakości i feedback w systemach crowdsourcingowych
30.05.2017
Filip Graliński
The RetroC challenge. How to guess the publication year of a text?
23.05.2017
Paweł Skórzewski
PSI-Toolkit – reaktywacja
Jak użycie Dockera tchnęło nowe życie w PSI-Toolkit i co jeszcze planujemy z tym zrobić
09.05.2017
Dawid Jurkiewicz
Wygładzanie metodą Knesera-Neya
25.04.2017
Rafał Jaworski
TMrepository – system do kolekcjonowania studenckich korpusów równoległych
04.04.2017
Filip Graliński
Temporalne modele języka
Podczas wystąpienia przedstawione zostaną (1) temporalne modele języka uwzględniające nie tylko dyskretny język, lecz także ciągły czas, (2) sposoby ewaluacji temporalnych modeli języka w ramach wyzwania uczenia maszynowego czy zadania typu „shared task”, (3) prace nad korpusem do ewaluacji temporalnych modeli języka polskiego.
28.03.2017
Piotr Kubiaczyk
QReport – rozproszone algorytmy raportowania
21.03.2017
Wojciech Włodarczyk
Kontrola jakości w systemach crowdsourcingowych
07.03.2017
Marek Kubis, Paweł Skórzewski
Action Ranking and Type Matching for End-User Development
28.02.2017
Rafał Jaworski
Classyf – kompilowanie słownika tematyczno-chronologizacyjnego
21.02.2017
Tomasz Dwojak
Efficient Algorithms for Hybrid Neural Machine Translation
24.01.2017
Tomasz Dwojak
Efficient Algorithms for Hybrid Neural Machine Translation
17.01.2017
Roman Grundkiewicz
Paper review: Minimum Risk Training for Neural Machine Translation
10.01.2017
Paweł Skórzewski
Paper review: Towards End-to-End Learning for Dialog State Tracking and Management (…)
03.01.2017
Wojciech Włodarczyk
Discussion about research plans
22.11.2016
Tomasz Dwojak
Multilingual neural machine translation
15.11.2016
Krzysztof Jassem
Diachroniczna normalizacja tekstów
08.11.2016
Paweł Skórzewski
End-user development using natural language
25.10.2016
Rafał Jaworski
Anubis
18.10.2016
Marcin Junczys-Dowmunt
Is neural machine translation ready for deployment? A case study on 30 translation directions
11.10.2016
Wojciech Włodarczyk
Crowdsourcing – presentation
04.10.2016
Roman Grundkiewicz
Kilka wniosków po ACL 2016 i MTM 2016
14.06.2016
Marcin Junczys-Dowmunt, Roman Grundkiewicz
The battle for the planet of the APEs
We are going to present the submission of the AMU team to the Automatic Post-Editing (APE) task of WMT 2016. We explore the application of neural translation models and achieve good results by treating different models as components in a log-linear model, allowing for multiple inputs that are decoded to the same target language. Our submission outperforms the uncorrected baseline on the unseen test set by -3.2% TER and +5.5% BLEU.
07.06.2016
Filip Graliński, Rafał Jaworski
Bieżące ciekawostki z NLP
31.05.2016
Patryk Żywica
Miary podobieństwa przedziałowych zbiorów rozmytych w klasyfikacji danych niepewnych. Zastosowania w diagnostyce guzów jajnika
Publiczna obrona rozprawy doktorskiej, sala A1-33/34, godzina 13:00.
24.05.2016
Paweł Skórzewski
Zastosowanie sieci neuronowych w tłumaczeniu automatycznym i normalizacji tekstu
17.05.2016
Filip Graliński
Gonito.net – open platform for research competition, cooperation and reproducibility
I am going to presents the current status of Gonito.net — an open source, web-based platform for hosting challenges for researchers in the field of natural language processing. Researchers are encouraged to compete in well-defined tasks by developing tools and running them on provided test data. The researcher who submits the best results becomes the winner of the challenge. Apart from the competition, Gonito.net also enables the collaboration among researchers by means of source code sharing mechanisms. Gonito.net itself is fully open source, i.e. its source is available for download and compilation, as well as a running instance of the system is available at gonito.net. The key design feature of Gonito.net is using Git for managing solutions of the problems submitted by competitors. This allows for research transparency and reproducibility.
10.05.2016
Łukasz Borchmann (Instytut Językoznawstwa UAM)
Analiza wydźwięku względem zagadnienia z tekstu
Przy niektórych zastosowaniach badanie wydźwięku (sentiment analysis) na poziomie dokumentu jest niewystarczające, ponieważ interesuje nas stosunek autora do konkretnego zagadnienia poruszanego w tekście (np. firmy lub cechy produktu). Gdy dokument zawiera treści związane z innymi tematami (np. odniesienia do podobnych marek lub ustępy tekstu dotyczące zupełnie niepowiązanych kwestii) zasadne jest zastosowanie rozwiązań, których przegląd będzie przedmiotem tej prezentacji, wraz z odniesieniami do eksperymentów na bazie ręcznie anotowanych tekstów w języku polskim.
26.04.2016
Tomasz Dwojak
AMU translation models for WMT’16. System description
19.04.2016
Krystyna Kułak (Wydział Anglistyki UAM)
Jak androidy śnią o elektrycznych owcach? Or: why can’t we all get along?
12.04.2016
Marcin Sikora
An introduction to automatic speech recognition
05.04.2016
Tomasz Obrębski
Dependency parser in Haskell
22.03.2016
Krzysztof Jassem
Sztuka programowania efektywnego, lekcja 1.
Przedstawiłem zarys pierwszej lekcji z książki opracowywanej we współpracy z Andrzejem Ziemkiewiczem, której celem jest wskazanie technik wydajnego programowania.
15.03.2016
Roman Grundkiewicz
Neural machine translation for automated grammatical error correction