Seminarium – Zakład Przetwarzania Języka Naturalnego

W związku z utworzeniem Zakładu Sztucznej Inteligencji od 1 stycznia 2020 seminarium Zakładu Przetwarzania Języka Naturalnego przekształciło się w Seminarium Modelowania Języka i Analizy Dyskursu. Informacje dotyczące programu nowego seminarium można znaleźć pod adresem ai.wmi.amu.edu.pl/seminars/lmda

Poniżej lista referatów przedstawionych na seminarium Pracowni Systemów Informacyjnych i Zakładu Przetwarzania Języka Naturalnego w latach 2016-2019.

17.12.2019
Weronika Sieińska (Heriot-Watt University)
Alana – an Entertaining and Informative Open-domain Social Chatbot

10.12.2019
Michał Głazik
Mnemotechniczne przedstawianie danych w języku polskim

03.12.2019
Robert Kwieciński
Introduction to recommender systems

19.11.2019
Dawid Jurkiewicz
Semantic similarity retrieval by analogy

05.11.2019
Karol Kaczmarek
World of Transformer (prezentacja)

29.10.2019
Wojciech Włodarczyk
Sprawdzamy, jak jest – crowdsourcing obywatelski

22.10.2019
Karolina Boczoń
Tokenizacja języków nieposiadających określonych granic wyrazów

08.10.2019
Jakub Pokrywka
Paper review: Massively Multilingual Sentence Embeddings for Zero-Shot Cross-Lingual Transfer and Beyond, Cross-lingual Language Model Pretraining (prezentacja)

24.09.2019
Filip Graliński
GEval – narzędzie do ewaluacji i diagnostyki „black-box” modeli uczenia maszynowego

10.09.2019
Waldemar Jęśko (PCSS)
Image recognition: logo recognition

03.09.2019
Filip Graliński
Teoria dziwności

27.08.2019
Magdalena Mozgawa
Międzynarodowy alfabet fonetyczny. Elementy fonetyki języka angielskiego

06.08.2019
Jakub Pokrywka
Podsumowanie konferencji SIGIR 2019

23.07.2019
Marcin Sikora
Data Augmentation Techniques for Automatic Speech Recognition

16.07.2019
Poznańskie Centrum Superkomputerowo-Sieciowe

09.07.2019
Roman Grundkiewicz (University of Edinburgh)
Recent advances in grammatical error correction

02.07.2019
Jolanta Bachan
A set of tools for analysis of speech fundamental frequency

25.06.2019
Aleksander Mendoza-Drosik
Metody formalne

18.06.2019
Robert Kwieciński (OLX)
Systemy rekomendacyjne dla serwisów ogłoszeniowych

18.06.2019
Michał Junczyk (Samsung)
Rozwiązania open source w obszarze nienadzorowanej produkcji danych mowy do treningu systemów ASR

11.06.2019
Piotr Radwan
Regułowe uczenie maszynowe
O metodach inferencji gramatyk

04.06.2019
Karolina Boczoń
Gramatyki kategorialne

28.05.2019
Krzysztof Jurkiewicz
Uczenie maszynowe

14.05.2019
Jakub Pokrywka
Redukcja wymiarowości: PCA, SNE, t-SNE, UMAP

07.05.2019
Krzysztof Jurkiewicz
Paper review: Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift, Batch Renormalization: Towards Reducing Minibatch Dependence in Batch-Normalized Models

16.04.2019
Rafał Jaworski
Concordia i Copycat – przeszukiwanie korpusów tekstów

09.04.2019
Tomasz Ziętkiewicz
Open Challenge for Correcting Errors of Speech Recognition Systems. Recent Advances in Error Correction of ASR

02.04.2019
Paweł Skórzewski
Using book dialogs to extract emotions from texts in Polish

19.03.2019
Jakub Pokrywka
NLP w wyszukiwarce e-commerce

12.03.2019
Karol Kaczmarek
Historia zakazanego modelu

05.03.2019
Dawid Jurkiewicz
Podobieństwo dokumentów

26.02.2019
Wojciech Włodarczyk
Nauczanie maszynowe

19.02.2019
Tomasz Ziętkiewicz
O algorytmach poprawy błędów w wynikach rozpoznawania mowy

12.02.2019
Tomasz Dwojak
Backtranslation: tworzenie dodatkowych danych do trenowania modeli NMT

29.01.2019
Tomasz Dwojak
Style transfer
Style transfer jest zadaniem, które polega na zmianie „stylu” tekstu (np. formalności lub grzeczności). Podczas prezentacji opowiem o moich badaniach i wynikach na ten temat, które prowadziłem podczas stażu w Grammarly.

15.01.2019
Weronika Sieińska
MovieDial – system dialogowy oparty na zestawie narzędzi PyDial

08.01.2019
Dawid Jurkiewicz
Paper review: On the Dimensionality of Word Embedding

11.12.2018
Tomasz Górecki
Metody badania współliniowości cech

04.12.2018
Karol Kaczmarek
Paper review: Focused Hierarchical RNNs for Conditional Sequence Processing

27.11.2018
Paweł Skórzewski
Analiza wydźwięku w oparciu o teorię emocji Plutchika

20.11.2018
Krzysztof Jassem
Dedykowane tłumaczenie automatyczne

30.10.2018
Jolanta Bachan
Badania lingwistyczne na korpusach mowy

23.10.2018
Łukasz Borchmann (Instytut Językoznawstwa UAM)
Approaching nested named entity recognition with parallel LSTM-CRFs

16.10.2018
Weronika Sieińska
Wyzwania motywujące głębokie uczenie maszynowe – przekleństwo wymiarowości

09.10.2018
Paweł Skórzewski
7th Dialog System Technology Challenge: Noetic End-to-End Response Selection

02.10.2018
Krzysztof Jassem
Probabilistic spell-checking

25.09.2018
Filip Graliński
Black-box debugging for Machine Learning models

18.09.2018
Rafał Szczukiewicz
Charakterystyka fonetyczna języka francuskiego

04.09.2018
Agnieszka Wagner
Stability of temporal patterns and rhythmic classification of Polish utterances: Towards a comprehensive definition of rhythm

28.08.2018
Karol Kaczmarek
Unsupervised learning methods based on huge data for the needs of supervised learning methods using small training sets – introduction

21.08.2018
Krzysztof Jurkiewicz
Challenges in neural network optimizations

14.08.2018
Piotr Radwan
Wyrażenia regularne i tłumaczenie gramatyk

31.07.2018
Krzysztof Jassem
Modele języka

17.07.2018
Adam Cankudis (TeamLeaders)
System wspomagający organizacje w kontaktach z klientem z wykorzystaniem IBM Watson Explorer

10.07.2018
Łukasz Borchmann (Instytut Językoznawstwa UAM)
A corpus-driven method of determining languages relatedness and (pre)history of their speakers

03.07.2018
Mieszko Wrzeszczyński
Paper review: How important is a neuron?

26.06.2018
Wojciech Włodarczyk
SpaceTag – wyniki badania pilotażowego

19.06.2018
Piotr Dura
On uncertainty in deep learning models

12.06.2018
Marek Kubis
Analiza sieci społecznych pozyskiwanych automatycznie z utworów literackich: dialogowanie, punkty artykulacji, centralność

05.06.2018
Marcin Sikora
Wykorzystanie sygnału wielokanałowego od podniesienia jakości automatycznego rozpoznawania mowy

29.05.2018
Tomasz Ziętkiewicz
Data driven text normalization

22.05.2018
Paweł Skórzewski
7th Dialog System Technology Challenge

15.05.2018
Agnieszka Ławrynowicz (Instytut Informatyki Politechniki Poznańskiej)
Translacja pytań kompetencyjnych w języku naturalnym do języka zapytań SPARQL-OWL
Ontologie są formalnymi specyfikacjami wiedzy terminologicznej i obecnie są coraz częściej wykorzystywane do integracji, opisu i organizacji danych i wiedzy, w zastosowaniach zarówno badawczych jak i przemysłowych. Jedną z części procesu tworzenia ontologii jest zapewnienie ich jakości, w tym wymaganego pokrycia modelowanego obszaru wiedzy. Wiele z metodyk inżynierii ontologii zawiera etap formułowania pytań kompetencyjnych, na które ontologia bądź też system informacyjny zbudowany w oparciu o nią powinne być w stanie udzielić odpowiedzi, tj. zawierać odpowiednie słownictwo jak i aksjomaty. Pytania kompetencyjne są wyrażone w języku naturalnym. Na kolejnych etapach tworzenia ontologii, pytania są manualnie formalizowane do języka zapytań ontologii i/lub baz wiedzy (najczęściej SPARQL), co jest żmudnym procesem, wymagającym znajomości formalnych języków modelowania. W prezentacji omówię zagadnienia automatycznej bądź też półautomatycznej translacji pytań kompetencyjnych do dialektu języka SPARQL.

08.05.2018
Mikołaj Sobkowiak
Koncepcja modelu pisanego języka duńskiego polskich studentów

24.04.2018
Tomasz Dwojak
Sieci konwolucyjne w przetwarzaniu obrazu i tekstu

17.04.2018
Weronika Sieińska
Paper review: Dialog System & Technology Challenge 6 Overview of Track 1 – End-to-End Goal-Oriented Dialog learning

10.04.2018
Piotr Dura
Paper review: Deep-FSMN for Large Vocabulary Continuous Speech Recognition

20.03.2018
Rafał Jaworski
Multisłownik – integracja polskich źródeł słownikowych

13.03.2018
Michał Głazik
Omówienie wybranych artykułów z Interspeech 2017 dotyczących nowoczesnych rozwiązań w rozpoznawaniu mowy

06.03.2018
Dawid Jurkiewicz
Wielojęzyczne zanurzenia słów bez użycia korpusu równoległego

27.02.2018
Agnieszka Kaliska (Instytut Filologii Romańskiej UAM)
Zastosowanie słowosieci w analizie leksykologicznej polskich i francuskich nazw technik wędkarskich

13.02.2018
Filip Graliński
“Diaeq” — diachronic equivalents as a challenge for machines

06.02.2018
Wojciech Włodarczyk
SpaceTag – zgrywalizowany system do zbierania danych lingwistycznych

23.01.2018
Roman Grundkiewicz
An exploration of neural sequence-to-sequence architectures for automatic post-editing

16.01.2018
Tomasz Dwojak
Marian z Poznania, czyli zestaw narzędzi do NMT

05.12.2017
Filip Graliński
Extracting spelling variant and temporal equivalents from raw diachronic corpora

28.11.2017
Paweł Skórzewski
Processing historical texts with contemporary NLP tools

21.11.2017
Krzysztof Jassem
Prezentacja systemu testów na zajęciach dydaktycznych

14.11.2017
Tomasz Dwojak
SUMMA – Scalable Understanding of Multilingual Media

24.10.2017
Rafał Jaworski
CLARIN – Common Language Resources and Technology Infrastructure

10.10.2017
Tomasz Ziętkiewicz
A knowledge-grounded neural conversation model

03.10.2017
Marek Kubis
SemEval-2017 – przegląd

26.09.2017
Mateusz Flieger
Głębokie uczenie ze wzmocnieniem

19.09.2017
Weronika Sieińska
Zastosowanie uczenia przez wzmacnianie do zarządzania dialogiem

12.09.2017
Roman Grundkiewicz
Grammatical error correction with machine translation

29.08.2017
Dawid Jurkiewicz
Distant Supervision
Podczas wystąpienia zostanie przedstawiony paradygmat Distant Supervision oraz proces ekstrakcji relacji na nim oparty.

22.08.2017
Piotr Radwan
Sieci neuronowe w ujęciu paradygmatu funkcyjnego

08.08.2017
Michał Głazik
Rekurencyjne sieci neuronowe typu LSTM

01.08.2017
Mieszko Wrzeszczyński
Algorytm wizualizacji danych t-SNE

25.07.2017
Piotr Dura
SEGAN – Speech Enhancement Generative Adversarial Network

18.07.2017
Jakub Pokrywka
Odszumianie sygnału przy pomocy funkcji o ograniczonym wahaniu
Prezentacja będzie na podstawie mojej pracy magisterskiej z matematyki „O pewnych zastosowaniach funkcji o ograniczonej wariacji”. Będę prezentował algorytm służący do odszumiania sygnału jednowymiarowego i sposób dojścia do niego przy wykorzystaniu funkcji o ograniczonym wahaniu.

27.06.2017
Łukasz Borchmann (Instytut Językoznawstwa UAM)
Od materiału drukowanego do elektronicznego słownika demonstracyjnego – historia Narodowego Fotokorpusu Języka Polskiego oraz pokrewnych projektów dla języka wietnamskiego i koreańskiego

13.06.2017
Paweł Skórzewski
PSI-Toolkit – rewolucje
Wzbogacenie PSI-Toolkitu o narzędzia do normalizacji diachronicznej

06.06.2017
Wojciech Włodarczyk
Ocena jakości i feedback w systemach crowdsourcingowych

30.05.2017
Filip Graliński
The RetroC challenge. How to guess the publication year of a text?

23.05.2017
Paweł Skórzewski
PSI-Toolkit – reaktywacja
Jak użycie Dockera tchnęło nowe życie w PSI-Toolkit i co jeszcze planujemy z tym zrobić

09.05.2017
Dawid Jurkiewicz
Wygładzanie metodą Knesera-Neya

25.04.2017
Rafał Jaworski
TMrepository – system do kolekcjonowania studenckich korpusów równoległych

04.04.2017
Filip Graliński
Temporalne modele języka
Podczas wystąpienia przedstawione zostaną (1) temporalne modele języka uwzględniające nie tylko dyskretny język, lecz także ciągły czas, (2) sposoby ewaluacji temporalnych modeli języka w ramach wyzwania uczenia maszynowego czy zadania typu „shared task”, (3) prace nad korpusem do ewaluacji temporalnych modeli języka polskiego.

28.03.2017
Piotr Kubiaczyk
QReport – rozproszone algorytmy raportowania

21.03.2017
Wojciech Włodarczyk
Kontrola jakości w systemach crowdsourcingowych

07.03.2017
Marek Kubis, Paweł Skórzewski
Action Ranking and Type Matching for End-User Development

28.02.2017
Rafał Jaworski
Classyf – kompilowanie słownika tematyczno-chronologizacyjnego

21.02.2017
Tomasz Dwojak
Efficient Algorithms for Hybrid Neural Machine Translation

24.01.2017
Tomasz Dwojak
Efficient Algorithms for Hybrid Neural Machine Translation

17.01.2017
Roman Grundkiewicz
Paper review: Minimum Risk Training for Neural Machine Translation

10.01.2017
Paweł Skórzewski
Paper review: Towards End-to-End Learning for Dialog State Tracking and Management (…)

03.01.2017
Wojciech Włodarczyk
Discussion about research plans

22.11.2016
Tomasz Dwojak
Multilingual neural machine translation

15.11.2016
Krzysztof Jassem
Diachroniczna normalizacja tekstów

08.11.2016
Paweł Skórzewski
End-user development using natural language

25.10.2016
Rafał Jaworski
Anubis

18.10.2016
Marcin Junczys-Dowmunt
Is neural machine translation ready for deployment? A case study on 30 translation directions

11.10.2016
Wojciech Włodarczyk
Crowdsourcing – presentation

04.10.2016
Roman Grundkiewicz
Kilka wniosków po ACL 2016 i MTM 2016

14.06.2016
Marcin Junczys-Dowmunt, Roman Grundkiewicz
The battle for the planet of the APEs
We are going to present the submission of the AMU team to the Automatic Post-Editing (APE) task of WMT 2016. We explore the application of neural translation models and achieve good results by treating different models as components in a log-linear model, allowing for multiple inputs that are decoded to the same target language. Our submission outperforms the uncorrected baseline on the unseen test set by -3.2% TER and +5.5% BLEU.

07.06.2016
Filip Graliński, Rafał Jaworski
Bieżące ciekawostki z NLP

31.05.2016
Patryk Żywica
Miary podobieństwa przedziałowych zbiorów rozmytych w klasyfikacji danych niepewnych. Zastosowania w diagnostyce guzów jajnika
Publiczna obrona rozprawy doktorskiej, sala A1-33/34, godzina 13:00.

24.05.2016
Paweł Skórzewski
Zastosowanie sieci neuronowych w tłumaczeniu automatycznym i normalizacji tekstu

17.05.2016
Filip Graliński
Gonito.net – open platform for research competition, cooperation and reproducibility
I am going to presents the current status of Gonito.net — an open source, web-based platform for hosting challenges for researchers in the field of natural language processing. Researchers are encouraged to compete in well-defined tasks by developing tools and running them on provided test data. The researcher who submits the best results becomes the winner of the challenge. Apart from the competition, Gonito.net also enables the collaboration among researchers by means of source code sharing mechanisms. Gonito.net itself is fully open source, i.e. its source is available for download and compilation, as well as a running instance of the system is available at gonito.net. The key design feature of Gonito.net is using Git for managing solutions of the problems submitted by competitors. This allows for research transparency and reproducibility.

10.05.2016
Łukasz Borchmann (Instytut Językoznawstwa UAM)
Analiza wydźwięku względem zagadnienia z tekstu
Przy niektórych zastosowaniach badanie wydźwięku (sentiment analysis) na poziomie dokumentu jest niewystarczające, ponieważ interesuje nas stosunek autora do konkretnego zagadnienia poruszanego w tekście (np. firmy lub cechy produktu). Gdy dokument zawiera treści związane z innymi tematami (np. odniesienia do podobnych marek lub ustępy tekstu dotyczące zupełnie niepowiązanych kwestii) zasadne jest zastosowanie rozwiązań, których przegląd będzie przedmiotem tej prezentacji, wraz z odniesieniami do eksperymentów na bazie ręcznie anotowanych tekstów w języku polskim.

26.04.2016
Tomasz Dwojak
AMU translation models for WMT’16. System description

19.04.2016
Krystyna Kułak (Wydział Anglistyki UAM)
Jak androidy śnią o elektrycznych owcach? Or: why can’t we all get along?

12.04.2016
Marcin Sikora
An introduction to automatic speech recognition

05.04.2016
Tomasz Obrębski
Dependency parser in Haskell

22.03.2016
Krzysztof Jassem
Sztuka programowania efektywnego, lekcja 1.
Przedstawiłem zarys pierwszej lekcji z książki opracowywanej we współpracy z Andrzejem Ziemkiewiczem, której celem jest wskazanie technik wydajnego programowania.

15.03.2016
Roman Grundkiewicz
Neural machine translation for automated grammatical error correction