## Почему важно закрывать файлы? 

Все открытые файлы автоматически закрываются, когда программа заканчивает работу. 

И потому все будет прекрасно работать, пока вы не решите создавать в своей программе промежуточные файлы, информация из которых затем используется в программе. 

In [76]:
cat = "cat.txt"
f = open(cat, "w")
f.write("Hello,")
f.write("world\n")
g = open(cat, "r")
print (g.read())





Тут внезапно выяснится, что вы что-то записали в файл, не закрыв его, этого там не оказалось, ваша программа не нашла, чего искала, и упала. 


Дело в том, что операции чтения/записи с жесткого диска не являются самыми быстрыми в мире. Потому система предпочитает записывать на жесткий диск не каждый раз, когда вы указали ей это сделать, а ждать, пока не наберется достаточно большой кусок данных. Потому в незакрытый файл вполне возможно запись произведена до конца работы программы и не будет.

А вот если его все же закрыть, то:

In [77]:
f.close()
print (g.read())
g.close()

Hello,world



Более того, часто в биоинформатике вам приходится писать программы, работающие долгое время, возможно, отвечая на тысячи задач. Если так случится, что вы забываете на каждый запрос закрыть файл, то в какой-то момент вы не сможете открыть новый файл и ваша программа завершится аварийно. По-умному такая ситуация называется "утечка файловых дескрипторов".

Демонстрация того, что будет, если открыть слишком много файлов (допустим, на запись, но это верно и для чтения):

In [None]:
# не запускайте этот код, если не готовы
# перезагружать тетрадь
opened_files = []

for i in range(1, 10000):
    fl = open(str(i), "w")
    opened_files.append(fl)

Для более наглядного поведения можете запустить скрипт с подобным кодом. Заметьте, что даже открытие одного и того же файла на чтение, но много раз, приводит к проблемам, т.к система позволяет иметь файл открытым множество раз.

In [80]:
open("1.txt", "w").close()
scr = '''
opened_files = []
for i in range(1, 10000):
    fl = open('1.txt', "r")
    opened_files.append(fl)
''' # another way to define multiline strings in Python

outfile = open("script.py", "w")
outfile.write(scr)
outfile.close()

Запуск команды в jupyter, как в командной строке - для этого просто в начале клетки ставите восклицательный знак

In [81]:
!python script.py

Traceback (most recent call last):
  File "script.py", line 4, in <module>
OSError: [Errno 24] Too many open files: '1.txt'


#  Исключения

В работе с Python мы часто сталкивались с исключительными ситуациями, в которых мы получали ошибки - **исключения**. Необработанное исключение приходит к завершению Python-программы

In [6]:
a = input()
b = input()
b = int(b)
print(a + b)

5
10


TypeError: must be str, not int

**Пример хорошей обработки исключений**

Медведь убежал из зоопарка, не могут найти.

Наконец звонит бабуля:

— Ой, ко мне во двор медведь забрался и на дерево залез! Уберите его, мне страшно!

Приезжает мужик с маленькой собачкой, даёт бабуле ружье, показывает на собачку и говорит:

— Бабуля, это Кефирчик. 
Я сейчас залезу наверх, встряхну ветку, медведь свалится, 
Кефирчик схватит его за ляжку и потащит в зоопарк.

— Хорошо, сынок. А зачем же мне ружье?

— Если вместо медведя свалюсь я, стреляй в Кефирчика!





В Python существует специальный механизм для отлова исключений - **try: ... except: ...**

In [82]:
1 / 0 

ZeroDivisionError: division by zero

In [58]:
try:
    1 / 0
except ZeroDivisionError:
    print("HI")

HI


Если не хотим ничего делать

In [None]:
try:
    1 / 0
except ZeroDivisionError:
    pass

Порой нам необходимо отловить несколько исключений. В этом случае просто пишем несколько блоков except

In [83]:
a = input()
b = input()
try:
    a = int(a) # possible error
    b = int(b) # possible error
    print (a / b)
except ValueError:
    print ("a and b must be integers")
except ZeroDivisionError:
    print ("b must be different from 0")

4
9i
a and b must be integers


Так же может возникнуть ситуация, когда мы хотим отлавливать исключения, которые являются подтипами друг друга. В этом случае необходимо указывать наиболее частное (ближе к низу в данной диаграмме) исключение первым.

![подтипы исключений](https://w3.cs.jmu.edu/spragunr/CS240_F14/activities/exceptions/exception_hierarchy.png)

Так не будет работать так, как хотим

In [84]:
a = input()
b = input()
try:
    a = int(a) # possible error
    b = int(b) # possible error
    print (a / b)
    print (a[0])
except Exception: # Exception usually is one of the most general Exceptions, it's highly recommended not to use more general exceptions
    print ("Other exception")
except ValueError:
    print ("a and b must be integers")
except ZeroDivisionError:
    print ("b must be different from 0")

p
5
Other exception


А это уже правильная последовательность

In [85]:
a = input()
b = input()
try:
    a = int(a) # possible error
    b = int(b) # possible error
    print (a / b)
    print (a[0])
except ValueError:
    print ("a and b must be integers")
except ZeroDivisionError:
    print ("b must be different from 0")
except Exception: # Exception usually is the most general Exception, it's highly recommended not to use more general exceptions
    print ("Other exception")

p
5
a and b must be integers


In [86]:
a = input()
b = input()
try:
    a = int(a) # possible error
    b = int(b) # possible error
    print (a / b)
    print (a[0])
except ValueError:
    print ("a and b must be integers")
except ZeroDivisionError:
    print ("b must be different from 0")

5
8
0.625


TypeError: 'int' object is not subscriptable

## Assert
**assert** позволяет проверить условие и вызвать ошибку, если условие не выполняется:

In [177]:
assert 10==10

In [178]:
assert 10==2

AssertionError: 

In [87]:
v1 = 10
v2 = 0
assert v2!=0, 'You passed wrong denominator'

AssertionError: You passed wrong denominator

Многие используют assert при поиске ошибок в своей программе, что, вообще говоря, неверно, но **всех это не очень задевает..**

## Чтение из сети. 

Больше информации: https://docs.python.org/3/howto/urllib2.html

In [88]:
import urllib.request

In [89]:
f = urllib.request.urlopen('http://python.org/')
html = f.read()

In [91]:
html



In [92]:
f = urllib.request.urlopen('http://python.org/')
f.readline()

b'<!doctype html>\n'

In [93]:
f = urllib.request.urlopen('htp://python.org/')

URLError: <urlopen error unknown url type: htp>

In [None]:
urllib.request.URLError

In [19]:
try:
    f = urllib.request.urlopen('htp://python.org/')
except urllib.request.URLError:
    print("wrong url")

wrong url


In [94]:
dir(urllib.request)

['AbstractBasicAuthHandler',
 'AbstractDigestAuthHandler',
 'AbstractHTTPHandler',
 'BaseHandler',
 'CacheFTPHandler',
 'ContentTooShortError',
 'DataHandler',
 'FTPHandler',
 'FancyURLopener',
 'FileHandler',
 'HTTPBasicAuthHandler',
 'HTTPCookieProcessor',
 'HTTPDefaultErrorHandler',
 'HTTPDigestAuthHandler',
 'HTTPError',
 'HTTPErrorProcessor',
 'HTTPHandler',
 'HTTPPasswordMgr',
 'HTTPPasswordMgrWithDefaultRealm',
 'HTTPPasswordMgrWithPriorAuth',
 'HTTPRedirectHandler',
 'HTTPSHandler',
 'MAXFTPCACHE',
 'OpenerDirector',
 'ProxyBasicAuthHandler',
 'ProxyDigestAuthHandler',
 'ProxyHandler',
 'Request',
 'URLError',
 'URLopener',
 'UnknownHandler',
 '__all__',
 '__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 '__version__',
 '_cut_port_re',
 '_ftperrors',
 '_have_ssl',
 '_localhost',
 '_noheaders',
 '_opener',
 '_parse_proxy',
 '_proxy_bypass_macosx_sysconf',
 '_randombytes',
 '_safe_gethostbyname',
 '_thishost',
 '_url

In [1]:
import math

In [3]:
math.log(28)

3.332204510175204

In [4]:
math.sqrt(2)

1.4142135623730951

In [7]:
math.log(10, 10)

TypeError: 'int' object is not callable

In [6]:
math.log = 10

In [None]:
math.log10(10)

In [8]:
import random

In [9]:
random

<module 'random' from 'D:\\Devel\\Anaconda3\\lib\\random.py'>

In [15]:
random.choice([1, 2, 3, -10])

2

In [None]:
random.

In [17]:
from random import choice
from random import random

In [18]:
random()

0.3848387110519822

In [19]:
?random

In [21]:
a = []
p = 0.5

In [22]:
for i in range(20):
    if random() < p:
        a.append(0)
    else:
        a.append(1)

In [23]:
a

[1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 1, 1, 1, 1]

In [58]:
from random import choice, random, sample

In [24]:
a = []
alphabet = "ATGC"
for i in range(20):
    al = choice(alphabet)
    a.append(al)


In [25]:
a

['A',
 'C',
 'A',
 'A',
 'T',
 'A',
 'A',
 'A',
 'T',
 'A',
 'G',
 'C',
 'T',
 'G',
 'T',
 'G',
 'C',
 'G',
 'C',
 'C']

In [72]:
"".join(a)

'CACCTGCGGTCGTACTACTG'

In [27]:
"yeah".join(a)

'AyeahCyeahAyeahAyeahTyeahAyeahAyeahAyeahTyeahAyeahGyeahCyeahTyeahGyeahTyeahGyeahCyeahGyeahCyeahC'

# sys.argv

In [28]:
from sys import argv

In [29]:
argv

['D:\\Devel\\Anaconda3\\lib\\site-packages\\ipykernel_launcher.py',
 '-f',
 'C:\\Users\\pdd\\AppData\\Roaming\\jupyter\\runtime\\kernel-7cdc5d93-ae37-491c-9dfd-dea7fadbb740.json']

In [30]:
scr = '''
from sys import argv
print(argv)
''' # another way to define multiline strings in Python

outfile = open("script_argv1.py", "w")
outfile.write(scr)
outfile.close()

In [31]:
!python script_argv1.py hello,\ Dima trash spec

['script_argv1.py', 'hello,\\', 'Dima', 'trash', 'spec']


In [32]:
scr = '''
from sys import argv
try:
    i = int(argv[1])
    j = int(argv[2])
    print(i, "*", j, "=",  i * j)
except:
    print("Non-integers")
''' # another way to define multiline strings in Python

outfile = open("script_argv2.py", "w")
outfile.write(scr)
outfile.close()

In [33]:
!python script_argv2.py 10 8 hello,\ Dima

10 * 8 = 80


In [34]:
!python script_argv2.py a 60 hello,\ Dima

Non-integers
