Chatbot seq2seq, oparty na RNN

Chatbot seq2seq składa się z 2 komponentów – kodera i dekodera RNN. System zaimplementowano przy użyciu biblioteki Tensorflow. Zadaniem enkodera jest utworzenie wewnętrznej reprezentacji wektorowej wpisywanego (rozpoznanego przy pomocy silnika rozpoznającego mowę) tekstu. Dekoder natomiast, otrzymawszy ową sekwencję, generuje tekst wyjściowy, najbardziej właściwy dla wpisanego na wejściu ciągu tekstowego. Do wyszkolenia modelu seq2seq wykorzystano zbiór danych z m.in. napisami filmowymi (z którego zostały wyodrębnione konwersacje pomiędzy bohaterami) oraz listami Beksińskiego. Baza składa się z par: {pytanie, odpowiedź} i zawiera ponad 100MB danych tekstowych.

Wykorzystane technologie: Tensorflow, RNN, Google Cloud