-
Notifications
You must be signed in to change notification settings - Fork 0
/
ner.py
96 lines (82 loc) · 1.69 KB
/
ner.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
from yargy import Parser, rule, and_
from yargy.predicates import gram, is_capitalized, dictionary
UNIVERSITY = rule(
dictionary({
'пнипу',
'политех',
'вуз',
'полик',
'пгту',
'универ',
'университет',
'институт'
})
)
ETF = rule(
dictionary({
'электротех',
'электротехнический',
'этф',
'электротехнический факультет'
})
)
HOSTEL = rule(
dictionary({
'общежитие',
'общага'
})
)
GNF = rule(
dictionary({
'гнф',
'горный',
'горно-нефтяной',
'горно нефтяной',
'нефтяной',
'горнонефтяной'
})
)
GUMF = rule(
dictionary({
'гум',
'гумфак',
'гуманитарный',
'гуманитарный факультет'
})
)
SCHOLARSHIP = rule(
dictionary({
'стипендия',
'стипа',
'стипуха'
})
)
G_SCHOLARSHIP = rule(
dictionary({
'губернаторская стипендия',
'губер'
})
)
MILITARY_DEPT = rule(
dictionary({
'военная кафедра'
})
)
MEDICAL_DOC = rule(
dictionary({
'мед справка',
'мёд справка',
'медицинская справка',
'086-у',
})
)
rules = {
"УНИВЕРСИТЕТ": UNIVERSITY,
"ЭТФ": ETF,"GNF": GNF,
"ГумФ": GUMF,
"СТИПЕНДИЯ": SCHOLARSHIP,
"ГУБЕР_СТИПЕНДИЯ": G_SCHOLARSHIP,
"ВОЕННАЯ_КАФЕДРА": MILITARY_DEPT,
"МЕДИЦИНСКАЯ_СПРАВКА": MEDICAL_DOC,
"ОБЩЕЖИТИЕ": HOSTEL
}