Kodomo

Пользователь

Отображение текста в формате reStructured невозможно без установки Docutils.

Недоконспект
############

Что мы по существу успели сделать:

 1. Написать половину ТЗ для соревнования:
 
  - Программа получает на вход:

   - таблицу с результатами соревнования в формате CSV с разделителем табуляция, колонки:

    - `1)` номер строки
    - `2)` номер токена в GS
    - `3)` токен в GS
    - `4)` лемма из GS
    - `5)` часть речи из GS
    - `6)` грамматический разбор в GS
    - `7-11)` то же, что и 2-5, но для Aqua2
    - `...` и т.д.

   - Выбор алгоритма оценщика:

    - строгий
    - мягкий
    - поиск ошибок в GS

   - Выбор данных, с которыми работает оценщик:

    - только леммы
    - только части речи
    - всё
 
  - Программа даёт на выходе:

   - либо таблицу с победителями (печатает на экран), столбцы:

    - парсер
    - счёт

   - либо строки входной таблицы, в которых есть ошибка GS, с комментарием, почему мы считаем, что здесь ошибка.
 
 Чего в этом ТЗ не хватает: описания того, как происходит выставление
 счёта парсеру. (Собственно, алгоритма оценки, который каждый из вас
 должен был сочинить как часть задания по комп. лингвистике).

 2. Более-менее все написали первую часть программы: разбор CSV и
 вытаскивание оттуда список лемм всех парсеров для каждой строки. (Мы
 это делали на занятии, так как большинство сказали, что они сходу не
 умеют эту задачу решать). Леммы лежат в столбцах с номерами 4 и 9+4*n
 (где n -- номер парсера, начинается с 0) Этим мы тоже занимались на
 паре, притом преимущественно в-одиночку, ибо это один из самых базовых
 навыков, и поэтому его полезно иметь каждому.

 3. Дальше народ разбился по группам и начал сочинять план реализации,
 который вам и является домашним заданием.

Ещё на доске в какой-то момент (после десятиминутного обсуждения)
возникла такая магическая строка, которую все счастливо переписали
себе в скрипты::

    lemmas = [cells[3]] + cells[8::4]

(где, для примера, можно в качестве cells взять
`['1', '1', 'Цветки', 'цветок', 'S', 'm,nom,pl', '1001', 'цветки',
'цветок', 'S', '100001', 'цветки', 'цветок', 'S', '10001', 'цветки',
'цветок', 'S', '10001', 'цветки', 'цветок', 'S', '10001', 'цветки',
'цветок', 'S', '10001', 'цветки', 'цветок', 'S', '10001', 'цветки',
'цветок', 'S']`)

А к чему эта строка возникла на доске -- загадка :)

.. vim: set et ts=4 sw=4 sts=4: