Отображение текста в формате reStructured невозможно без установки Docutils.
Недоконспект
############
Что мы по существу успели сделать:
1. Написать половину ТЗ для соревнования:
- Программа получает на вход:
- таблицу с результатами соревнования в формате CSV с разделителем табуляция, колонки:
- `1)` номер строки
- `2)` номер токена в GS
- `3)` токен в GS
- `4)` лемма из GS
- `5)` часть речи из GS
- `6)` грамматический разбор в GS
- `7-11)` то же, что и 2-5, но для Aqua2
- `...` и т.д.
- Выбор алгоритма оценщика:
- строгий
- мягкий
- поиск ошибок в GS
- Выбор данных, с которыми работает оценщик:
- только леммы
- только части речи
- всё
- Программа даёт на выходе:
- либо таблицу с победителями (печатает на экран), столбцы:
- парсер
- счёт
- либо строки входной таблицы, в которых есть ошибка GS, с комментарием, почему мы считаем, что здесь ошибка.
Чего в этом ТЗ не хватает: описания того, как происходит выставление
счёта парсеру. (Собственно, алгоритма оценки, который каждый из вас
должен был сочинить как часть задания по комп. лингвистике).
2. Более-менее все написали первую часть программы: разбор CSV и
вытаскивание оттуда список лемм всех парсеров для каждой строки. (Мы
это делали на занятии, так как большинство сказали, что они сходу не
умеют эту задачу решать). Леммы лежат в столбцах с номерами 4 и 9+4*n
(где n -- номер парсера, начинается с 0) Этим мы тоже занимались на
паре, притом преимущественно в-одиночку, ибо это один из самых базовых
навыков, и поэтому его полезно иметь каждому.
3. Дальше народ разбился по группам и начал сочинять план реализации,
который вам и является домашним заданием.
Ещё на доске в какой-то момент (после десятиминутного обсуждения)
возникла такая магическая строка, которую все счастливо переписали
себе в скрипты::
lemmas = [cells[3]] + cells[8::4]
(где, для примера, можно в качестве cells взять
`['1', '1', 'Цветки', 'цветок', 'S', 'm,nom,pl', '1001', 'цветки',
'цветок', 'S', '100001', 'цветки', 'цветок', 'S', '10001', 'цветки',
'цветок', 'S', '10001', 'цветки', 'цветок', 'S', '10001', 'цветки',
'цветок', 'S', '10001', 'цветки', 'цветок', 'S', '10001', 'цветки',
'цветок', 'S']`)
А к чему эта строка возникла на доске -- загадка :)
.. vim: set et ts=4 sw=4 sts=4: