ДЗ №6
Создайте в репозитории папочку hw6.
Напишите программу wikidata.py. Откройте какую-нибудь статью из википедии и сохраните её текст себе в программу в переменную text. Статья должна быть достаточно большой (больше 10 абзацев).
С помощью re.findall() найдите на этой странице:
- все номера сносок (число в квадратных скобках)
- все римские числа
- все числа, стоящие сами по себе (вокруг них пробелы; включая дробные числа, числа, разбитые пробелами на разряды)
- как можно больше имён собственных (начинаются с большой буквы, перед ними нет конца предложения)
- как можно больше прилагательных (нужно напрячься и придумать, какие у них бывают окончания)
Напишите программу phones.py. Откройте на сайте http://mospages.ru/ страницу любого раздела или буквы и сохраните её текст в файл phones.txt. В программе откройте файл и с помощью re.findall найдите на странице все номера телефонов.
Напишите программу top30.py, которая открывает файл text.txt (наполните его достаточно объёмным содержимым, например, текстовыми данными из прошлых заданий), читает его, разбивает по словам (split), строит словарь, в котором для каждого слова хранится сколько раз оно встретилось, и выводит 30 самых частых слов и количество находок.