mirror of
https://github.com/morpheus65535/bazarr.git
synced 2025-04-24 22:57:13 -04:00
replace langdetect with guess_language-spirit. resolves #799
This commit is contained in:
parent
7c8f6c988d
commit
d0c1330362
141 changed files with 20935 additions and 1529 deletions
|
@ -6,7 +6,7 @@ import os
|
||||||
import babelfish
|
import babelfish
|
||||||
import logging
|
import logging
|
||||||
import ast
|
import ast
|
||||||
import langdetect
|
from guess_language import guess_language
|
||||||
import subliminal
|
import subliminal
|
||||||
import subliminal_patch
|
import subliminal_patch
|
||||||
import operator
|
import operator
|
||||||
|
@ -384,7 +384,7 @@ def guess_external_subtitles(dest_folder, subtitles):
|
||||||
encoding = UnicodeDammit(text)
|
encoding = UnicodeDammit(text)
|
||||||
if six.PY2:
|
if six.PY2:
|
||||||
text = text.decode(encoding.original_encoding)
|
text = text.decode(encoding.original_encoding)
|
||||||
detected_language = langdetect.detect(text)
|
detected_language = guess_language(text)
|
||||||
except Exception as e:
|
except Exception as e:
|
||||||
logging.exception('BAZARR Error trying to detect language for this subtitles file: ' +
|
logging.exception('BAZARR Error trying to detect language for this subtitles file: ' +
|
||||||
subtitle_path + ' You should try to delete this subtitles file manually and ask '
|
subtitle_path + ' You should try to delete this subtitles file manually and ask '
|
||||||
|
|
666
libs/guess_language/__init__.py
Normal file
666
libs/guess_language/__init__.py
Normal file
|
@ -0,0 +1,666 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
"""Guess the natural language of a text
|
||||||
|
"""
|
||||||
|
# © 2012 spirit <hiddenspirit@gmail.com>
|
||||||
|
# https://bitbucket.org/spirit/guess_language
|
||||||
|
#
|
||||||
|
# Original Python package:
|
||||||
|
# Copyright (c) 2008, Kent S Johnson
|
||||||
|
# http://code.google.com/p/guess-language/
|
||||||
|
#
|
||||||
|
# Original C++ version for KDE:
|
||||||
|
# Copyright (c) 2006 Jacob R Rideout <kde@jacobrideout.net>
|
||||||
|
# http://websvn.kde.org/branches/work/sonnet-refactoring/common/nlp/guesslanguage.cpp?view=markup
|
||||||
|
#
|
||||||
|
# Original Language::Guess Perl module:
|
||||||
|
# Copyright (c) 2004-2006 Maciej Ceglowski
|
||||||
|
# http://web.archive.org/web/20090228163219/http://languid.cantbedone.org/
|
||||||
|
#
|
||||||
|
# Note: Language::Guess is GPL-licensed. KDE developers received permission
|
||||||
|
# from the author to distribute their port under LGPL:
|
||||||
|
# http://lists.kde.org/?l=kde-sonnet&m=116910092228811&w=2
|
||||||
|
#
|
||||||
|
# This program is free software: you can redistribute it and/or modify it
|
||||||
|
# under the terms of the GNU Lesser General Public License as published
|
||||||
|
# by the Free Software Foundation, either version 3 of the License,
|
||||||
|
# or (at your option) any later version.
|
||||||
|
#
|
||||||
|
# This program is distributed in the hope that it will be useful,
|
||||||
|
# but WITHOUT ANY WARRANTY; without even the implied warranty
|
||||||
|
# of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
|
||||||
|
# See the GNU Lesser General Public License for more details.
|
||||||
|
#
|
||||||
|
# You should have received a copy of the GNU Lesser General Public License
|
||||||
|
# along with this program. If not, see <http://www.gnu.org/licenses/>.
|
||||||
|
|
||||||
|
from __future__ import unicode_literals
|
||||||
|
|
||||||
|
import functools
|
||||||
|
import re
|
||||||
|
import warnings
|
||||||
|
|
||||||
|
from collections import defaultdict, OrderedDict
|
||||||
|
|
||||||
|
from .data import BLOCKS, BLOCK_RSHIFT
|
||||||
|
|
||||||
|
|
||||||
|
__all__ = [
|
||||||
|
"guess_language", "use_enchant",
|
||||||
|
]
|
||||||
|
|
||||||
|
MAX_LENGTH = 4096
|
||||||
|
MIN_LENGTH = 20
|
||||||
|
MAX_GRAMS = 300
|
||||||
|
WORD_RE = re.compile(r"(?:[^\W\d_]|['’])+", re.U)
|
||||||
|
MODEL_ROOT = __name__ + ".data.models."
|
||||||
|
FALLBACK_LANGUAGE = "en_US"
|
||||||
|
|
||||||
|
BASIC_LATIN = {
|
||||||
|
"ceb", "en", "eu", "ha", "haw", "id", "la", "nr", "nso", "so", "ss", "st",
|
||||||
|
"sw", "tlh", "tn", "ts", "xh", "zu"
|
||||||
|
}
|
||||||
|
EXTENDED_LATIN = {
|
||||||
|
"af", "az", "ca", "cs", "cy", "da", "de", "eo", "es", "et", "fi", "fr",
|
||||||
|
"hr", "hu", "is", "it", "lt", "lv", "nb", "nl", "pl", "pt", "ro", "sk",
|
||||||
|
"sl", "sq", "sv", "tl", "tr", "ve", "vi"
|
||||||
|
}
|
||||||
|
ALL_LATIN = BASIC_LATIN.union(EXTENDED_LATIN)
|
||||||
|
CYRILLIC = {"bg", "kk", "ky", "mk", "mn", "ru", "sr", "uk", "uz"}
|
||||||
|
ARABIC = {"ar", "fa", "ps", "ur"}
|
||||||
|
DEVANAGARI = {"hi", "ne"}
|
||||||
|
PT = {"pt_BR", "pt_PT"}
|
||||||
|
|
||||||
|
# NOTE mn appears twice, once for mongolian script and once for CYRILLIC
|
||||||
|
SINGLETONS = [
|
||||||
|
("Armenian", "hy"),
|
||||||
|
("Hebrew", "he"),
|
||||||
|
("Bengali", "bn"),
|
||||||
|
("Gurmukhi", "pa"),
|
||||||
|
("Greek", "el"),
|
||||||
|
("Gujarati", "gu"),
|
||||||
|
("Oriya", "or"),
|
||||||
|
("Tamil", "ta"),
|
||||||
|
("Telugu", "te"),
|
||||||
|
("Kannada", "kn"),
|
||||||
|
("Malayalam", "ml"),
|
||||||
|
("Sinhala", "si"),
|
||||||
|
("Thai", "th"),
|
||||||
|
("Lao", "lo"),
|
||||||
|
("Tibetan", "bo"),
|
||||||
|
("Burmese", "my"),
|
||||||
|
("Georgian", "ka"),
|
||||||
|
("Mongolian", "mn-Mong"),
|
||||||
|
("Khmer", "km"),
|
||||||
|
]
|
||||||
|
|
||||||
|
NAME_MAP = {
|
||||||
|
"ab": "Abkhazian",
|
||||||
|
"af": "Afrikaans",
|
||||||
|
"ar": "Arabic",
|
||||||
|
"az": "Azeri",
|
||||||
|
"be": "Byelorussian",
|
||||||
|
"bg": "Bulgarian",
|
||||||
|
"bn": "Bengali",
|
||||||
|
"bo": "Tibetan",
|
||||||
|
"br": "Breton",
|
||||||
|
"ca": "Catalan",
|
||||||
|
"ceb": "Cebuano",
|
||||||
|
"cs": "Czech",
|
||||||
|
"cy": "Welsh",
|
||||||
|
"da": "Danish",
|
||||||
|
"de": "German",
|
||||||
|
"el": "Greek",
|
||||||
|
"en": "English",
|
||||||
|
"eo": "Esperanto",
|
||||||
|
"es": "Spanish",
|
||||||
|
"et": "Estonian",
|
||||||
|
"eu": "Basque",
|
||||||
|
"fa": "Farsi",
|
||||||
|
"fi": "Finnish",
|
||||||
|
"fo": "Faroese",
|
||||||
|
"fr": "French",
|
||||||
|
"fy": "Frisian",
|
||||||
|
"gd": "Scots Gaelic",
|
||||||
|
"gl": "Galician",
|
||||||
|
"gu": "Gujarati",
|
||||||
|
"ha": "Hausa",
|
||||||
|
"haw": "Hawaiian",
|
||||||
|
"he": "Hebrew",
|
||||||
|
"hi": "Hindi",
|
||||||
|
"hr": "Croatian",
|
||||||
|
"hu": "Hungarian",
|
||||||
|
"hy": "Armenian",
|
||||||
|
"id": "Indonesian",
|
||||||
|
"is": "Icelandic",
|
||||||
|
"it": "Italian",
|
||||||
|
"ja": "Japanese",
|
||||||
|
"ka": "Georgian",
|
||||||
|
"kk": "Kazakh",
|
||||||
|
"km": "Cambodian",
|
||||||
|
"ko": "Korean",
|
||||||
|
"ku": "Kurdish",
|
||||||
|
"ky": "Kyrgyz",
|
||||||
|
"la": "Latin",
|
||||||
|
"lt": "Lithuanian",
|
||||||
|
"lv": "Latvian",
|
||||||
|
"mg": "Malagasy",
|
||||||
|
"mk": "Macedonian",
|
||||||
|
"ml": "Malayalam",
|
||||||
|
"mn": "Mongolian",
|
||||||
|
"mr": "Marathi",
|
||||||
|
"ms": "Malay",
|
||||||
|
"nd": "Ndebele",
|
||||||
|
"ne": "Nepali",
|
||||||
|
"nl": "Dutch",
|
||||||
|
"nn": "Nynorsk",
|
||||||
|
"no": "Norwegian",
|
||||||
|
"nso": "Sepedi",
|
||||||
|
"pa": "Punjabi",
|
||||||
|
"pl": "Polish",
|
||||||
|
"ps": "Pashto",
|
||||||
|
"pt": "Portuguese",
|
||||||
|
"pt_PT": "Portuguese (Portugal)",
|
||||||
|
"pt_BR": "Portuguese (Brazil)",
|
||||||
|
"ro": "Romanian",
|
||||||
|
"ru": "Russian",
|
||||||
|
"sa": "Sanskrit",
|
||||||
|
"sh": "Serbo-Croatian",
|
||||||
|
"sk": "Slovak",
|
||||||
|
"sl": "Slovene",
|
||||||
|
"so": "Somali",
|
||||||
|
"sq": "Albanian",
|
||||||
|
"sr": "Serbian",
|
||||||
|
"sv": "Swedish",
|
||||||
|
"sw": "Swahili",
|
||||||
|
"ta": "Tamil",
|
||||||
|
"te": "Telugu",
|
||||||
|
"th": "Thai",
|
||||||
|
"tl": "Tagalog",
|
||||||
|
"tlh": "Klingon",
|
||||||
|
"tn": "Setswana",
|
||||||
|
"tr": "Turkish",
|
||||||
|
"ts": "Tsonga",
|
||||||
|
"tw": "Twi",
|
||||||
|
"uk": "Ukrainian",
|
||||||
|
"ur": "Urdu",
|
||||||
|
"uz": "Uzbek",
|
||||||
|
"ve": "Venda",
|
||||||
|
"vi": "Vietnamese",
|
||||||
|
"xh": "Xhosa",
|
||||||
|
"zh": "Chinese",
|
||||||
|
"zh_TW": "Traditional Chinese (Taiwan)",
|
||||||
|
"zu": "Zulu",
|
||||||
|
}
|
||||||
|
|
||||||
|
IANA_MAP = {
|
||||||
|
"ab": 12026,
|
||||||
|
"af": 40,
|
||||||
|
"ar": 26020,
|
||||||
|
"az": 26030,
|
||||||
|
"be": 11890,
|
||||||
|
"bg": 26050,
|
||||||
|
"bn": 26040,
|
||||||
|
"bo": 26601,
|
||||||
|
"br": 1361,
|
||||||
|
"ca": 3,
|
||||||
|
"ceb": 26060,
|
||||||
|
"cs": 26080,
|
||||||
|
"cy": 26560,
|
||||||
|
"da": 26090,
|
||||||
|
"de": 26160,
|
||||||
|
"el": 26165,
|
||||||
|
"en": 26110,
|
||||||
|
"eo": 11933,
|
||||||
|
"es": 26460,
|
||||||
|
"et": 26120,
|
||||||
|
"eu": 1232,
|
||||||
|
"fa": 26130,
|
||||||
|
"fi": 26140,
|
||||||
|
"fo": 11817,
|
||||||
|
"fr": 26150,
|
||||||
|
"fy": 1353,
|
||||||
|
"gd": 65555,
|
||||||
|
"gl": 1252,
|
||||||
|
"gu": 26599,
|
||||||
|
"ha": 26170,
|
||||||
|
"haw": 26180,
|
||||||
|
"he": 26592,
|
||||||
|
"hi": 26190,
|
||||||
|
"hr": 26070,
|
||||||
|
"hu": 26200,
|
||||||
|
"hy": 26597,
|
||||||
|
"id": 26220,
|
||||||
|
"is": 26210,
|
||||||
|
"it": 26230,
|
||||||
|
"ja": 26235,
|
||||||
|
"ka": 26600,
|
||||||
|
"kk": 26240,
|
||||||
|
"km": 1222,
|
||||||
|
"ko": 26255,
|
||||||
|
"ku": 11815,
|
||||||
|
"ky": 26260,
|
||||||
|
"la": 26280,
|
||||||
|
"lt": 26300,
|
||||||
|
"lv": 26290,
|
||||||
|
"mg": 1362,
|
||||||
|
"mk": 26310,
|
||||||
|
"ml": 26598,
|
||||||
|
"mn": 26320,
|
||||||
|
"mr": 1201,
|
||||||
|
"ms": 1147,
|
||||||
|
"ne": 26330,
|
||||||
|
"nl": 26100,
|
||||||
|
"nn": 172,
|
||||||
|
"no": 26340,
|
||||||
|
"pa": 65550,
|
||||||
|
"pl": 26380,
|
||||||
|
"ps": 26350,
|
||||||
|
"pt": 26390,
|
||||||
|
"ro": 26400,
|
||||||
|
"ru": 26410,
|
||||||
|
"sa": 1500,
|
||||||
|
"sh": 1399,
|
||||||
|
"sk": 26430,
|
||||||
|
"sl": 26440,
|
||||||
|
"so": 26450,
|
||||||
|
"sq": 26010,
|
||||||
|
"sr": 26420,
|
||||||
|
"sv": 26480,
|
||||||
|
"sw": 26470,
|
||||||
|
"ta": 26595,
|
||||||
|
"te": 26596,
|
||||||
|
"th": 26594,
|
||||||
|
"tl": 26490,
|
||||||
|
"tlh": 26250,
|
||||||
|
"tn": 65578,
|
||||||
|
"tr": 26500,
|
||||||
|
"tw": 1499,
|
||||||
|
"uk": 26520,
|
||||||
|
"ur": 26530,
|
||||||
|
"uz": 26540,
|
||||||
|
"vi": 26550,
|
||||||
|
"zh": 26065,
|
||||||
|
"zh_TW": 22,
|
||||||
|
}
|
||||||
|
|
||||||
|
models = {}
|
||||||
|
|
||||||
|
try:
|
||||||
|
from importlib import import_module
|
||||||
|
except ImportError:
|
||||||
|
import sys
|
||||||
|
|
||||||
|
def import_module(name):
|
||||||
|
"""Import a module.
|
||||||
|
"""
|
||||||
|
__import__(name)
|
||||||
|
return sys.modules[name]
|
||||||
|
|
||||||
|
try:
|
||||||
|
from collections import namedtuple
|
||||||
|
|
||||||
|
LanguageInfo = namedtuple("LanguageInfo", ["tag", "id", "name"])
|
||||||
|
except ImportError:
|
||||||
|
class LanguageInfo(tuple):
|
||||||
|
def __new__(cls, tag, id, name): #@ReservedAssignment
|
||||||
|
return tuple.__new__(cls, (tag, id, name))
|
||||||
|
|
||||||
|
def __init__(self, tag, id, name): #@ReservedAssignment
|
||||||
|
self.tag = tag
|
||||||
|
self.id = id
|
||||||
|
self.name = name
|
||||||
|
|
||||||
|
|
||||||
|
class UNKNOWN(str):
|
||||||
|
"""Unknown language
|
||||||
|
"""
|
||||||
|
def __bool__(self):
|
||||||
|
return False
|
||||||
|
|
||||||
|
def __nonzero__(self):
|
||||||
|
return False
|
||||||
|
|
||||||
|
|
||||||
|
UNKNOWN = UNKNOWN("UNKNOWN")
|
||||||
|
|
||||||
|
|
||||||
|
def guess_language(text, hints=None):
|
||||||
|
"""Return the ISO 639-1 language code.
|
||||||
|
"""
|
||||||
|
words = WORD_RE.findall(text[:MAX_LENGTH].replace("’", "'"))
|
||||||
|
return identify(words, find_runs(words), hints)
|
||||||
|
|
||||||
|
|
||||||
|
def guess_language_info(text, hints=None):
|
||||||
|
"""Return LanguageInfo(tag, id, name).
|
||||||
|
"""
|
||||||
|
tag = guess_language(text, hints)
|
||||||
|
|
||||||
|
if tag is UNKNOWN:
|
||||||
|
return LanguageInfo(UNKNOWN, UNKNOWN, UNKNOWN)
|
||||||
|
|
||||||
|
return LanguageInfo(tag, _get_id(tag), _get_name(tag))
|
||||||
|
|
||||||
|
|
||||||
|
# An alias for guess_language
|
||||||
|
guess_language_tag = guess_language
|
||||||
|
|
||||||
|
|
||||||
|
def guess_language_id(text, hints=None):
|
||||||
|
"""Return the language ID.
|
||||||
|
"""
|
||||||
|
return _get_id(guess_language(text, hints))
|
||||||
|
|
||||||
|
|
||||||
|
def guess_language_name(text, hints=None):
|
||||||
|
"""Return the language name (in English).
|
||||||
|
"""
|
||||||
|
return _get_name(guess_language(text, hints))
|
||||||
|
|
||||||
|
|
||||||
|
def _get_id(tag):
|
||||||
|
return IANA_MAP.get(tag, UNKNOWN)
|
||||||
|
|
||||||
|
|
||||||
|
def _get_name(tag):
|
||||||
|
return NAME_MAP.get(tag, UNKNOWN)
|
||||||
|
|
||||||
|
|
||||||
|
def find_runs(words):
|
||||||
|
"""Count the number of characters in each character block.
|
||||||
|
"""
|
||||||
|
run_types = defaultdict(int)
|
||||||
|
|
||||||
|
total_count = 0
|
||||||
|
|
||||||
|
for word in words:
|
||||||
|
for char in word:
|
||||||
|
block = BLOCKS[ord(char) >> BLOCK_RSHIFT]
|
||||||
|
run_types[block] += 1
|
||||||
|
total_count += 1
|
||||||
|
|
||||||
|
#pprint(run_types)
|
||||||
|
|
||||||
|
# return run types that used for 40% or more of the string
|
||||||
|
# return Basic Latin if found more than 15%
|
||||||
|
## and extended additional latin if over 10% (for Vietnamese)
|
||||||
|
relevant_runs = []
|
||||||
|
for key, value in run_types.items():
|
||||||
|
pct = value * 100 // total_count
|
||||||
|
if pct >= 40 or pct >= 15 and key == "Basic Latin":
|
||||||
|
relevant_runs.append(key)
|
||||||
|
#elif pct >= 10 and key == "Latin Extended Additional":
|
||||||
|
#relevant_runs.append(key)
|
||||||
|
|
||||||
|
return relevant_runs
|
||||||
|
|
||||||
|
|
||||||
|
def identify(words, scripts, hints=None):
|
||||||
|
"""Identify the language.
|
||||||
|
"""
|
||||||
|
if ("Hangul Syllables" in scripts or "Hangul Jamo" in scripts or
|
||||||
|
"Hangul Compatibility Jamo" in scripts or "Hangul" in scripts):
|
||||||
|
return "ko"
|
||||||
|
|
||||||
|
if "Greek and Coptic" in scripts:
|
||||||
|
return "el"
|
||||||
|
|
||||||
|
if "Kana" in scripts:
|
||||||
|
return "ja"
|
||||||
|
|
||||||
|
if ("CJK Unified Ideographs" in scripts or "Bopomofo" in scripts or
|
||||||
|
"Bopomofo Extended" in scripts or "KangXi Radicals" in scripts):
|
||||||
|
# This is in both Ceglowski and Rideout
|
||||||
|
# I can't imagine why...
|
||||||
|
# or "Arabic Presentation Forms-A" in scripts
|
||||||
|
return "zh"
|
||||||
|
|
||||||
|
if "Cyrillic" in scripts:
|
||||||
|
return check(words, filter_languages(CYRILLIC, hints))
|
||||||
|
|
||||||
|
if ("Arabic" in scripts or "Arabic Presentation Forms-A" in scripts or
|
||||||
|
"Arabic Presentation Forms-B" in scripts):
|
||||||
|
return check(words, filter_languages(ARABIC, hints))
|
||||||
|
|
||||||
|
if "Devanagari" in scripts:
|
||||||
|
return check(words, filter_languages(DEVANAGARI, hints))
|
||||||
|
|
||||||
|
# Try languages with unique scripts
|
||||||
|
for block_name, lang_name in SINGLETONS:
|
||||||
|
if block_name in scripts:
|
||||||
|
return lang_name
|
||||||
|
|
||||||
|
#if "Latin Extended Additional" in scripts:
|
||||||
|
#return "vi"
|
||||||
|
|
||||||
|
if "Extended Latin" in scripts:
|
||||||
|
latin_lang = check(words, filter_languages(EXTENDED_LATIN, hints))
|
||||||
|
if latin_lang == "pt":
|
||||||
|
return check(words, filter_languages(PT))
|
||||||
|
else:
|
||||||
|
return latin_lang
|
||||||
|
|
||||||
|
if "Basic Latin" in scripts:
|
||||||
|
return check(words, filter_languages(ALL_LATIN, hints))
|
||||||
|
|
||||||
|
return UNKNOWN
|
||||||
|
|
||||||
|
|
||||||
|
def filter_languages(languages, hints=None):
|
||||||
|
"""Filter languages.
|
||||||
|
"""
|
||||||
|
return languages.intersection(hints) if hints else languages
|
||||||
|
|
||||||
|
|
||||||
|
def check_with_all(words, languages):
|
||||||
|
"""Check what the best match is.
|
||||||
|
"""
|
||||||
|
return (check_with_enchant(words, languages) or
|
||||||
|
check_with_models(words, languages))
|
||||||
|
|
||||||
|
|
||||||
|
check = check_with_all
|
||||||
|
|
||||||
|
|
||||||
|
def use_enchant(use_enchant=True):
|
||||||
|
"""Enable or disable checking with PyEnchant.
|
||||||
|
"""
|
||||||
|
global check
|
||||||
|
check = check_with_all if use_enchant else check_with_models
|
||||||
|
|
||||||
|
|
||||||
|
def check_with_models(words, languages):
|
||||||
|
"""Check against known models.
|
||||||
|
"""
|
||||||
|
sample = " ".join(words)
|
||||||
|
|
||||||
|
if len(sample) < MIN_LENGTH:
|
||||||
|
return UNKNOWN
|
||||||
|
|
||||||
|
scores = []
|
||||||
|
model = create_ordered_model(sample) # QMap<int,QString>
|
||||||
|
|
||||||
|
for key in languages:
|
||||||
|
lkey = key.lower()
|
||||||
|
|
||||||
|
try:
|
||||||
|
known_model = models[lkey]
|
||||||
|
except KeyError:
|
||||||
|
try:
|
||||||
|
known_model = import_module(MODEL_ROOT + lkey).model
|
||||||
|
except ImportError:
|
||||||
|
known_model = None
|
||||||
|
models[lkey] = known_model
|
||||||
|
|
||||||
|
if known_model:
|
||||||
|
scores.append((distance(model, known_model), key))
|
||||||
|
|
||||||
|
if not scores:
|
||||||
|
return UNKNOWN
|
||||||
|
|
||||||
|
# we want the lowest score, less distance = greater chance of match
|
||||||
|
#pprint(sorted(scores))
|
||||||
|
return min(scores)[1]
|
||||||
|
|
||||||
|
|
||||||
|
def create_ordered_model(content):
|
||||||
|
"""Create a list of trigrams in content sorted by frequency.
|
||||||
|
"""
|
||||||
|
trigrams = defaultdict(int) # QHash<QString,int>
|
||||||
|
content = content.lower()
|
||||||
|
|
||||||
|
for i in range(len(content) - 2):
|
||||||
|
trigrams[content[i:i+3]] += 1
|
||||||
|
|
||||||
|
return sorted(trigrams.keys(), key=lambda k: (-trigrams[k], k))
|
||||||
|
|
||||||
|
|
||||||
|
def distance(model, known_model):
|
||||||
|
"""Calculate the distance to the known model.
|
||||||
|
"""
|
||||||
|
dist = 0
|
||||||
|
|
||||||
|
for i, value in enumerate(model[:MAX_GRAMS]):
|
||||||
|
if value in known_model:
|
||||||
|
dist += abs(i - known_model[value])
|
||||||
|
else:
|
||||||
|
dist += MAX_GRAMS
|
||||||
|
|
||||||
|
return dist
|
||||||
|
|
||||||
|
|
||||||
|
try:
|
||||||
|
import enchant
|
||||||
|
except ImportError:
|
||||||
|
warnings.warn("PyEnchant is unavailable", ImportWarning)
|
||||||
|
enchant = None
|
||||||
|
|
||||||
|
def check_with_enchant(*args, **kwargs):
|
||||||
|
return UNKNOWN
|
||||||
|
else:
|
||||||
|
import locale
|
||||||
|
|
||||||
|
enchant_base_languages_dict = None
|
||||||
|
|
||||||
|
def check_with_enchant(words, languages,
|
||||||
|
threshold=0.7, min_words=1, dictionaries={}):
|
||||||
|
"""Check against installed spelling dictionaries.
|
||||||
|
"""
|
||||||
|
if len(words) < min_words:
|
||||||
|
return UNKNOWN
|
||||||
|
|
||||||
|
best_score = 0
|
||||||
|
best_tag = UNKNOWN
|
||||||
|
|
||||||
|
for tag, enchant_tag in get_enchant_base_languages_dict().items():
|
||||||
|
if tag not in languages:
|
||||||
|
continue
|
||||||
|
try:
|
||||||
|
d = dictionaries[tag]
|
||||||
|
except KeyError:
|
||||||
|
d = dictionaries[tag] = enchant.Dict(enchant_tag)
|
||||||
|
score = sum([1 for word in words if d.check(word)])
|
||||||
|
if score > best_score:
|
||||||
|
best_score = score
|
||||||
|
best_tag = tag
|
||||||
|
|
||||||
|
if float(best_score) / len(words) < threshold:
|
||||||
|
return UNKNOWN
|
||||||
|
|
||||||
|
return best_tag
|
||||||
|
|
||||||
|
def get_enchant_base_languages_dict():
|
||||||
|
"""Get ordered dictionary of enchant base languages.
|
||||||
|
|
||||||
|
locale_language, then "en", then the rest.
|
||||||
|
"""
|
||||||
|
global enchant_base_languages_dict
|
||||||
|
if enchant_base_languages_dict is None:
|
||||||
|
def get_language_sub_tag(tag):
|
||||||
|
return tag.split("_")[0]
|
||||||
|
enchant_base_languages_dict = OrderedDict()
|
||||||
|
enchant_languages = sorted(enchant.list_languages())
|
||||||
|
for full_tag in [get_locale_language(), FALLBACK_LANGUAGE]:
|
||||||
|
sub_tag = get_language_sub_tag(full_tag)
|
||||||
|
if sub_tag not in enchant_base_languages_dict:
|
||||||
|
for tag in [full_tag, sub_tag]:
|
||||||
|
try:
|
||||||
|
index = enchant_languages.index(tag)
|
||||||
|
except ValueError:
|
||||||
|
pass
|
||||||
|
else:
|
||||||
|
enchant_base_languages_dict[sub_tag] = tag
|
||||||
|
del enchant_languages[index]
|
||||||
|
break
|
||||||
|
for tag in enchant_languages:
|
||||||
|
sub_tag = get_language_sub_tag(tag)
|
||||||
|
if sub_tag not in enchant_base_languages_dict:
|
||||||
|
enchant_base_languages_dict[sub_tag] = tag
|
||||||
|
return enchant_base_languages_dict
|
||||||
|
|
||||||
|
def get_locale_language():
|
||||||
|
"""Get the language code for the current locale setting.
|
||||||
|
"""
|
||||||
|
return (locale.getlocale()[0] or locale.getdefaultlocale()[0] or
|
||||||
|
FALLBACK_LANGUAGE)
|
||||||
|
|
||||||
|
|
||||||
|
def deprecated(func):
|
||||||
|
"""This is a decorator which can be used to mark functions
|
||||||
|
as deprecated. It will result in a warning being emitted
|
||||||
|
when the function is used.
|
||||||
|
"""
|
||||||
|
@functools.wraps(func)
|
||||||
|
def new_func(*args, **kwargs):
|
||||||
|
warnings.warn(
|
||||||
|
"call to deprecated function %s()" % func.__name__,
|
||||||
|
category=DeprecationWarning,
|
||||||
|
stacklevel=2
|
||||||
|
)
|
||||||
|
return func(*args, **kwargs)
|
||||||
|
return new_func
|
||||||
|
|
||||||
|
|
||||||
|
@deprecated
|
||||||
|
def guessLanguage(text):
|
||||||
|
"""Deprecated function - use guess_language() instead.
|
||||||
|
"""
|
||||||
|
return guess_language(decode_text(text))
|
||||||
|
|
||||||
|
|
||||||
|
@deprecated
|
||||||
|
def guessLanguageTag(text):
|
||||||
|
"""Deprecated function - use guess_language_tag() instead.
|
||||||
|
"""
|
||||||
|
return guess_language_tag(decode_text(text))
|
||||||
|
|
||||||
|
|
||||||
|
@deprecated
|
||||||
|
def guessLanguageId(text):
|
||||||
|
"""Deprecated function - use guess_language_id() instead.
|
||||||
|
"""
|
||||||
|
return guess_language_id(decode_text(text))
|
||||||
|
|
||||||
|
|
||||||
|
@deprecated
|
||||||
|
def guessLanguageName(text):
|
||||||
|
"""Deprecated function - use guess_language_name() instead.
|
||||||
|
"""
|
||||||
|
return guess_language_name(decode_text(text))
|
||||||
|
|
||||||
|
|
||||||
|
@deprecated
|
||||||
|
def guessLanguageInfo(text):
|
||||||
|
"""Deprecated function - use guess_language_info() instead.
|
||||||
|
"""
|
||||||
|
return guess_language_info(decode_text(text))
|
||||||
|
|
||||||
|
|
||||||
|
def decode_text(text, encoding="utf-8"):
|
||||||
|
"""Decode text if needed (for deprecated functions).
|
||||||
|
"""
|
||||||
|
if not isinstance(text, str):
|
||||||
|
warnings.warn("passing an encoded string is deprecated",
|
||||||
|
DeprecationWarning, 4)
|
||||||
|
text = text.decode(encoding)
|
||||||
|
return text
|
53
libs/guess_language/__main__.py
Normal file
53
libs/guess_language/__main__.py
Normal file
|
@ -0,0 +1,53 @@
|
||||||
|
"""Guess the natural language of a text
|
||||||
|
"""
|
||||||
|
|
||||||
|
import argparse
|
||||||
|
import locale
|
||||||
|
import os
|
||||||
|
import sys
|
||||||
|
|
||||||
|
import guess_language.console_mode #@UnusedImport
|
||||||
|
|
||||||
|
|
||||||
|
def parse_args():
|
||||||
|
parser = argparse.ArgumentParser(
|
||||||
|
description=__doc__.strip(),
|
||||||
|
prog="{} -m {}".format(os.path.basename(sys.executable),
|
||||||
|
"guess_language")
|
||||||
|
)
|
||||||
|
parser.add_argument("file",
|
||||||
|
help="plain text file or “-” for stdin")
|
||||||
|
parser.add_argument("-c", "--encoding",
|
||||||
|
help="input encoding")
|
||||||
|
parser.add_argument("--disable-enchant", dest="use_enchant",
|
||||||
|
action="store_false",
|
||||||
|
help="disable enchant")
|
||||||
|
return parser.parse_args()
|
||||||
|
|
||||||
|
|
||||||
|
def main():
|
||||||
|
args = parse_args()
|
||||||
|
|
||||||
|
if args.file == "-":
|
||||||
|
file = sys.stdin.fileno()
|
||||||
|
encoding = args.encoding or (
|
||||||
|
sys.stdin.encoding if sys.stdin.isatty()
|
||||||
|
else locale.getpreferredencoding()
|
||||||
|
)
|
||||||
|
else:
|
||||||
|
file = args.file
|
||||||
|
encoding = args.encoding or "utf-8"
|
||||||
|
|
||||||
|
with open(file, encoding=encoding) as f:
|
||||||
|
text = "".join(f.readlines())
|
||||||
|
|
||||||
|
if not args.use_enchant:
|
||||||
|
guess_language.use_enchant(False)
|
||||||
|
tag = guess_language.guess_language(text)
|
||||||
|
print(tag)
|
||||||
|
|
||||||
|
return 0 if tag else 1
|
||||||
|
|
||||||
|
|
||||||
|
if __name__ == "__main__":
|
||||||
|
sys.exit(main())
|
63
libs/guess_language/console_mode.py
Normal file
63
libs/guess_language/console_mode.py
Normal file
|
@ -0,0 +1,63 @@
|
||||||
|
"""Write to stdout without causing UnicodeEncodeError
|
||||||
|
"""
|
||||||
|
|
||||||
|
import sys
|
||||||
|
|
||||||
|
|
||||||
|
if (getattr(sys.stdout, "errors", "") == "strict" and
|
||||||
|
not getattr(sys.stdout, "encoding", "").lower().startswith("utf")):
|
||||||
|
try:
|
||||||
|
import translit
|
||||||
|
sys.stdout = translit.StreamFilter(sys.stdout)
|
||||||
|
except ImportError:
|
||||||
|
import codecs
|
||||||
|
import unicodedata
|
||||||
|
import warnings
|
||||||
|
|
||||||
|
TRANSLIT_MAP = {
|
||||||
|
0x2018: "'",
|
||||||
|
0x2019: "'",
|
||||||
|
0x201c: '"',
|
||||||
|
0x201d: '"',
|
||||||
|
}
|
||||||
|
|
||||||
|
def simplify(s):
|
||||||
|
s = s.translate(TRANSLIT_MAP)
|
||||||
|
return "".join([c for c in unicodedata.normalize("NFKD", s)
|
||||||
|
if not unicodedata.combining(c)])
|
||||||
|
|
||||||
|
def simple_translit_error_handler(error):
|
||||||
|
if not isinstance(error, UnicodeEncodeError):
|
||||||
|
raise error
|
||||||
|
chunk = error.object[error.start:error.end]
|
||||||
|
repl = simplify(chunk)
|
||||||
|
repl = (repl.encode(error.encoding, "backslashreplace")
|
||||||
|
.decode(error.encoding))
|
||||||
|
return repl, error.end
|
||||||
|
|
||||||
|
class SimpleTranslitStreamFilter:
|
||||||
|
"""Filter a stream through simple transliteration.
|
||||||
|
"""
|
||||||
|
errors = "simple_translit"
|
||||||
|
|
||||||
|
def __init__(self, target):
|
||||||
|
self.target = target
|
||||||
|
|
||||||
|
def __getattr__(self, name):
|
||||||
|
return getattr(self.target, name)
|
||||||
|
|
||||||
|
def write(self, s):
|
||||||
|
self.target.write(self.downgrade(s))
|
||||||
|
|
||||||
|
def writelines(self, lines):
|
||||||
|
self.target.writelines(
|
||||||
|
[self.downgrade(line) for line in lines])
|
||||||
|
|
||||||
|
def downgrade(self, s):
|
||||||
|
return (s.encode(self.target.encoding, self.errors)
|
||||||
|
.decode(self.target.encoding))
|
||||||
|
|
||||||
|
codecs.register_error(SimpleTranslitStreamFilter.errors,
|
||||||
|
simple_translit_error_handler)
|
||||||
|
sys.stdout = SimpleTranslitStreamFilter(sys.stdout)
|
||||||
|
warnings.warn("translit is unavailable", ImportWarning)
|
152
libs/guess_language/data/__init__.py
Normal file
152
libs/guess_language/data/__init__.py
Normal file
|
@ -0,0 +1,152 @@
|
||||||
|
BLOCK_RSHIFT = 4
|
||||||
|
BLOCKS = [None] * 0x2fa2
|
||||||
|
BLOCKS[0x0:0x8] = ['Basic Latin'] * 0x8
|
||||||
|
BLOCKS[0x8:0x10] = ['Extended Latin'] * 0x8 # Latin-1 Supplement
|
||||||
|
BLOCKS[0x10:0x18] = ['Extended Latin'] * 0x8 # Latin Extended-A
|
||||||
|
BLOCKS[0x18:0x25] = ['Latin Extended-B'] * 0xd
|
||||||
|
BLOCKS[0x25:0x2b] = ['Extended Latin'] * 0x6 # IPA Extensions
|
||||||
|
BLOCKS[0x2b:0x30] = ['Spacing Modifier Letters'] * 0x5
|
||||||
|
BLOCKS[0x37:0x40] = ['Greek and Coptic'] * 0x9
|
||||||
|
BLOCKS[0x40:0x50] = ['Cyrillic'] * 0x10
|
||||||
|
BLOCKS[0x50:0x53] = ['Cyrillic Supplement'] * 0x3
|
||||||
|
BLOCKS[0x53:0x59] = ['Armenian'] * 0x6
|
||||||
|
BLOCKS[0x59:0x60] = ['Hebrew'] * 0x7
|
||||||
|
BLOCKS[0x60:0x70] = ['Arabic'] * 0x10
|
||||||
|
BLOCKS[0x70:0x75] = ['Syriac'] * 0x5
|
||||||
|
BLOCKS[0x75:0x78] = ['Arabic Supplement'] * 0x3
|
||||||
|
BLOCKS[0x78:0x7c] = ['Thaana'] * 0x4
|
||||||
|
BLOCKS[0x7c:0x80] = ['NKo'] * 0x4
|
||||||
|
BLOCKS[0x80:0x84] = ['Samaritan'] * 0x4
|
||||||
|
BLOCKS[0x84:0x86] = ['Mandaic'] * 0x2
|
||||||
|
BLOCKS[0x8a:0x90] = ['Arabic Extended-A'] * 0x6
|
||||||
|
BLOCKS[0x90:0x98] = ['Devanagari'] * 0x8
|
||||||
|
BLOCKS[0x98:0xa0] = ['Bengali'] * 0x8
|
||||||
|
BLOCKS[0xa0:0xa8] = ['Gurmukhi'] * 0x8
|
||||||
|
BLOCKS[0xa8:0xb0] = ['Gujarati'] * 0x8
|
||||||
|
BLOCKS[0xb0:0xb8] = ['Oriya'] * 0x8
|
||||||
|
BLOCKS[0xb8:0xc0] = ['Tamil'] * 0x8
|
||||||
|
BLOCKS[0xc0:0xc8] = ['Telugu'] * 0x8
|
||||||
|
BLOCKS[0xc8:0xd0] = ['Kannada'] * 0x8
|
||||||
|
BLOCKS[0xd0:0xd8] = ['Malayalam'] * 0x8
|
||||||
|
BLOCKS[0xd8:0xe0] = ['Sinhala'] * 0x8
|
||||||
|
BLOCKS[0xe0:0xe8] = ['Thai'] * 0x8
|
||||||
|
BLOCKS[0xe8:0xf0] = ['Lao'] * 0x8
|
||||||
|
BLOCKS[0xf0:0x100] = ['Tibetan'] * 0x10
|
||||||
|
BLOCKS[0x100:0x10a] = ['Myanmar'] * 0xa
|
||||||
|
BLOCKS[0x10a:0x110] = ['Georgian'] * 0x6
|
||||||
|
BLOCKS[0x110:0x120] = ['Hangul Jamo'] * 0x10
|
||||||
|
BLOCKS[0x120:0x138] = ['Ethiopic'] * 0x18
|
||||||
|
BLOCKS[0x138:0x13a] = ['Ethiopic Supplement'] * 0x2
|
||||||
|
BLOCKS[0x13a:0x140] = ['Cherokee'] * 0x6
|
||||||
|
BLOCKS[0x140:0x168] = ['Unified Canadian Aboriginal Syllabics'] * 0x28
|
||||||
|
BLOCKS[0x168:0x16a] = ['Ogham'] * 0x2
|
||||||
|
BLOCKS[0x16a:0x170] = ['Runic'] * 0x6
|
||||||
|
BLOCKS[0x170:0x172] = ['Tagalog'] * 0x2
|
||||||
|
BLOCKS[0x172:0x174] = ['Hanunoo'] * 0x2
|
||||||
|
BLOCKS[0x174:0x176] = ['Buhid'] * 0x2
|
||||||
|
BLOCKS[0x176:0x178] = ['Tagbanwa'] * 0x2
|
||||||
|
BLOCKS[0x178:0x180] = ['Khmer'] * 0x8
|
||||||
|
BLOCKS[0x180:0x18b] = ['Mongolian'] * 0xb
|
||||||
|
BLOCKS[0x18b:0x190] = ['Unified Canadian Aboriginal Syllabics Extended'] * 0x5
|
||||||
|
BLOCKS[0x190:0x195] = ['Limbu'] * 0x5
|
||||||
|
BLOCKS[0x195:0x198] = ['Tai Le'] * 0x3
|
||||||
|
BLOCKS[0x198:0x19e] = ['New Tai Lue'] * 0x6
|
||||||
|
BLOCKS[0x1a0:0x1a2] = ['Buginese'] * 0x2
|
||||||
|
BLOCKS[0x1a2:0x1ab] = ['Tai Tham'] * 0x9
|
||||||
|
BLOCKS[0x1b0:0x1b8] = ['Balinese'] * 0x8
|
||||||
|
BLOCKS[0x1b8:0x1bc] = ['Sundanese'] * 0x4
|
||||||
|
BLOCKS[0x1bc:0x1c0] = ['Batak'] * 0x4
|
||||||
|
BLOCKS[0x1c0:0x1c5] = ['Lepcha'] * 0x5
|
||||||
|
BLOCKS[0x1c5:0x1c8] = ['Ol Chiki'] * 0x3
|
||||||
|
BLOCKS[0x1cd:0x1d0] = ['Vedic Extensions'] * 0x3
|
||||||
|
BLOCKS[0x1d0:0x1d8] = ['Phonetic Extensions'] * 0x8
|
||||||
|
BLOCKS[0x1d8:0x1dc] = ['Phonetic Extensions Supplement'] * 0x4
|
||||||
|
BLOCKS[0x1e0:0x1f0] = ['Latin Extended Additional'] * 0x10
|
||||||
|
BLOCKS[0x1f0:0x200] = ['Greek Extended'] * 0x10
|
||||||
|
BLOCKS[0x207:0x20a] = ['Superscripts and Subscripts'] * 0x3
|
||||||
|
BLOCKS[0x210:0x215] = ['Letterlike Symbols'] * 0x5
|
||||||
|
BLOCKS[0x215:0x219] = ['Number Forms'] * 0x4
|
||||||
|
BLOCKS[0x2c0:0x2c6] = ['Glagolitic'] * 0x6
|
||||||
|
BLOCKS[0x2c6:0x2c8] = ['Latin Extended-C'] * 0x2
|
||||||
|
BLOCKS[0x2c8:0x2d0] = ['Coptic'] * 0x8
|
||||||
|
BLOCKS[0x2d0:0x2d3] = ['Georgian Supplement'] * 0x3
|
||||||
|
BLOCKS[0x2d3:0x2d8] = ['Tifinagh'] * 0x5
|
||||||
|
BLOCKS[0x2d8:0x2de] = ['Ethiopic Extended'] * 0x6
|
||||||
|
BLOCKS[0x2e0:0x2e8] = ['Supplemental Punctuation'] * 0x8
|
||||||
|
BLOCKS[0x300:0x304] = ['CJK Symbols and Punctuation'] * 0x4
|
||||||
|
BLOCKS[0x304:0x30a] = ['Kana'] * 0x6 # Hiragana
|
||||||
|
BLOCKS[0x30a:0x310] = ['Kana'] * 0x6 # Katakana
|
||||||
|
BLOCKS[0x310:0x313] = ['Bopomofo'] * 0x3
|
||||||
|
BLOCKS[0x313:0x319] = ['Hangul Compatibility Jamo'] * 0x6
|
||||||
|
BLOCKS[0x31a:0x31c] = ['Bopomofo Extended'] * 0x2
|
||||||
|
BLOCKS[0x31f:0x320] = ['Kana'] * 0x1 # Katakana Phonetic Extensions
|
||||||
|
BLOCKS[0x340:0x4dc] = ['CJK Unified Ideographs Extension A'] * 0x19c
|
||||||
|
BLOCKS[0x4e0:0xa00] = ['CJK Unified Ideographs'] * 0x520
|
||||||
|
BLOCKS[0xa00:0xa49] = ['Yi Syllables'] * 0x49
|
||||||
|
BLOCKS[0xa4d:0xa50] = ['Lisu'] * 0x3
|
||||||
|
BLOCKS[0xa50:0xa64] = ['Vai'] * 0x14
|
||||||
|
BLOCKS[0xa64:0xa6a] = ['Cyrillic Extended-B'] * 0x6
|
||||||
|
BLOCKS[0xa6a:0xa70] = ['Bamum'] * 0x6
|
||||||
|
BLOCKS[0xa70:0xa72] = ['Modifier Tone Letters'] * 0x2
|
||||||
|
BLOCKS[0xa72:0xa80] = ['Latin Extended-D'] * 0xe
|
||||||
|
BLOCKS[0xa80:0xa83] = ['Syloti Nagri'] * 0x3
|
||||||
|
BLOCKS[0xa84:0xa88] = ['Phags-pa'] * 0x4
|
||||||
|
BLOCKS[0xa88:0xa8e] = ['Saurashtra'] * 0x6
|
||||||
|
BLOCKS[0xa8e:0xa90] = ['Devanagari Extended'] * 0x2
|
||||||
|
BLOCKS[0xa90:0xa93] = ['Kayah Li'] * 0x3
|
||||||
|
BLOCKS[0xa93:0xa96] = ['Rejang'] * 0x3
|
||||||
|
BLOCKS[0xa96:0xa98] = ['Hangul Jamo Extended-A'] * 0x2
|
||||||
|
BLOCKS[0xa98:0xa9e] = ['Javanese'] * 0x6
|
||||||
|
BLOCKS[0xaa0:0xaa6] = ['Cham'] * 0x6
|
||||||
|
BLOCKS[0xaa6:0xaa8] = ['Myanmar Extended-A'] * 0x2
|
||||||
|
BLOCKS[0xaa8:0xaae] = ['Tai Viet'] * 0x6
|
||||||
|
BLOCKS[0xaae:0xab0] = ['Meetei Mayek Extensions'] * 0x2
|
||||||
|
BLOCKS[0xab0:0xab3] = ['Ethiopic Extended-A'] * 0x3
|
||||||
|
BLOCKS[0xabc:0xac0] = ['Meetei Mayek'] * 0x4
|
||||||
|
BLOCKS[0xac0:0xd7b] = ['Hangul Syllables'] * 0x2bb
|
||||||
|
BLOCKS[0xd7b:0xd80] = ['Hangul Jamo Extended-B'] * 0x5
|
||||||
|
BLOCKS[0xf90:0xfb0] = ['CJK Compatibility Ideographs'] * 0x20
|
||||||
|
BLOCKS[0xfb0:0xfb5] = ['Alphabetic Presentation Forms'] * 0x5
|
||||||
|
BLOCKS[0xfb5:0xfe0] = ['Arabic Presentation Forms-A'] * 0x2b
|
||||||
|
BLOCKS[0xfe7:0xff0] = ['Arabic Presentation Forms-B'] * 0x9
|
||||||
|
BLOCKS[0xff0:0xfff] = ['Halfwidth and Fullwidth Forms'] * 0xf
|
||||||
|
BLOCKS[0x1000:0x1008] = ['Linear B Syllabary'] * 0x8
|
||||||
|
BLOCKS[0x1008:0x1010] = ['Linear B Ideograms'] * 0x8
|
||||||
|
BLOCKS[0x1028:0x102a] = ['Lycian'] * 0x2
|
||||||
|
BLOCKS[0x102a:0x102e] = ['Carian'] * 0x4
|
||||||
|
BLOCKS[0x1030:0x1033] = ['Old Italic'] * 0x3
|
||||||
|
BLOCKS[0x1033:0x1035] = ['Gothic'] * 0x2
|
||||||
|
BLOCKS[0x1038:0x103a] = ['Ugaritic'] * 0x2
|
||||||
|
BLOCKS[0x103a:0x103e] = ['Old Persian'] * 0x4
|
||||||
|
BLOCKS[0x1040:0x1045] = ['Deseret'] * 0x5
|
||||||
|
BLOCKS[0x1045:0x1048] = ['Shavian'] * 0x3
|
||||||
|
BLOCKS[0x1048:0x104b] = ['Osmanya'] * 0x3
|
||||||
|
BLOCKS[0x1080:0x1084] = ['Cypriot Syllabary'] * 0x4
|
||||||
|
BLOCKS[0x1084:0x1086] = ['Imperial Aramaic'] * 0x2
|
||||||
|
BLOCKS[0x1090:0x1092] = ['Phoenician'] * 0x2
|
||||||
|
BLOCKS[0x1092:0x1094] = ['Lydian'] * 0x2
|
||||||
|
BLOCKS[0x1098:0x109a] = ['Meroitic Hieroglyphs'] * 0x2
|
||||||
|
BLOCKS[0x109a:0x10a0] = ['Meroitic Cursive'] * 0x6
|
||||||
|
BLOCKS[0x10a0:0x10a6] = ['Kharoshthi'] * 0x6
|
||||||
|
BLOCKS[0x10a6:0x10a8] = ['Old South Arabian'] * 0x2
|
||||||
|
BLOCKS[0x10b0:0x10b4] = ['Avestan'] * 0x4
|
||||||
|
BLOCKS[0x10b4:0x10b6] = ['Inscriptional Parthian'] * 0x2
|
||||||
|
BLOCKS[0x10b6:0x10b8] = ['Inscriptional Pahlavi'] * 0x2
|
||||||
|
BLOCKS[0x10c0:0x10c5] = ['Old Turkic'] * 0x5
|
||||||
|
BLOCKS[0x1100:0x1108] = ['Brahmi'] * 0x8
|
||||||
|
BLOCKS[0x1108:0x110d] = ['Kaithi'] * 0x5
|
||||||
|
BLOCKS[0x110d:0x1110] = ['Sora Sompeng'] * 0x3
|
||||||
|
BLOCKS[0x1110:0x1115] = ['Chakma'] * 0x5
|
||||||
|
BLOCKS[0x1118:0x111e] = ['Sharada'] * 0x6
|
||||||
|
BLOCKS[0x1168:0x116d] = ['Takri'] * 0x5
|
||||||
|
BLOCKS[0x1200:0x1240] = ['Cuneiform'] * 0x40
|
||||||
|
BLOCKS[0x1300:0x1343] = ['Egyptian Hieroglyphs'] * 0x43
|
||||||
|
BLOCKS[0x1680:0x16a4] = ['Bamum Supplement'] * 0x24
|
||||||
|
BLOCKS[0x16f0:0x16fa] = ['Miao'] * 0xa
|
||||||
|
BLOCKS[0x1b00:0x1b10] = ['Kana Supplement'] * 0x10
|
||||||
|
BLOCKS[0x1d40:0x1d80] = ['Mathematical Alphanumeric Symbols'] * 0x40
|
||||||
|
BLOCKS[0x1ee0:0x1ef0] = ['Arabic Mathematical Alphabetic Symbols'] * 0x10
|
||||||
|
BLOCKS[0x2000:0x2a6e] = ['CJK Unified Ideographs Extension B'] * 0xa6e
|
||||||
|
BLOCKS[0x2a70:0x2b74] = ['CJK Unified Ideographs Extension C'] * 0x104
|
||||||
|
BLOCKS[0x2b74:0x2b82] = ['CJK Unified Ideographs Extension D'] * 0xe
|
||||||
|
BLOCKS[0x2f80:0x2fa2] = ['CJK Compatibility Ideographs Supplement'] * 0x22
|
303
libs/guess_language/data/models/af.py
Normal file
303
libs/guess_language/data/models/af.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'ie ': 0,
|
||||||
|
' di': 1,
|
||||||
|
'die': 2,
|
||||||
|
'en ': 3,
|
||||||
|
'ing': 4,
|
||||||
|
'an ': 5,
|
||||||
|
' en': 6,
|
||||||
|
'van': 7,
|
||||||
|
' va': 8,
|
||||||
|
'ng ': 9,
|
||||||
|
'te ': 10,
|
||||||
|
'n d': 11,
|
||||||
|
'ver': 12,
|
||||||
|
'er ': 13,
|
||||||
|
'e v': 14,
|
||||||
|
' ge': 15,
|
||||||
|
' be': 16,
|
||||||
|
'de ': 17,
|
||||||
|
' ve': 18,
|
||||||
|
'nde': 19,
|
||||||
|
' in': 20,
|
||||||
|
' te': 21,
|
||||||
|
'le ': 22,
|
||||||
|
'der': 23,
|
||||||
|
'ers': 24,
|
||||||
|
'et ': 25,
|
||||||
|
'oor': 26,
|
||||||
|
" 'n": 27,
|
||||||
|
"'n ": 28,
|
||||||
|
'at ': 29,
|
||||||
|
'eer': 30,
|
||||||
|
'ste': 31,
|
||||||
|
'ord': 32,
|
||||||
|
'aar': 33,
|
||||||
|
'sie': 34,
|
||||||
|
' wa': 35,
|
||||||
|
'es ': 36,
|
||||||
|
'e s': 37,
|
||||||
|
'aan': 38,
|
||||||
|
' on': 39,
|
||||||
|
'is ': 40,
|
||||||
|
'in ': 41,
|
||||||
|
'e o': 42,
|
||||||
|
'rde': 43,
|
||||||
|
'e b': 44,
|
||||||
|
'asi': 45,
|
||||||
|
'rin': 46,
|
||||||
|
'ond': 47,
|
||||||
|
'e w': 48,
|
||||||
|
'el ': 49,
|
||||||
|
' is': 50,
|
||||||
|
'and': 51,
|
||||||
|
'e e': 52,
|
||||||
|
'eid': 53,
|
||||||
|
'e d': 54,
|
||||||
|
'om ': 55,
|
||||||
|
'ke ': 56,
|
||||||
|
' om': 57,
|
||||||
|
'eri': 58,
|
||||||
|
' wo': 59,
|
||||||
|
'e g': 60,
|
||||||
|
'r d': 61,
|
||||||
|
'ale': 62,
|
||||||
|
'wat': 63,
|
||||||
|
' vo': 64,
|
||||||
|
'id ': 65,
|
||||||
|
'it ': 66,
|
||||||
|
'rd ': 67,
|
||||||
|
' aa': 68,
|
||||||
|
'lik': 69,
|
||||||
|
' we': 70,
|
||||||
|
't d': 71,
|
||||||
|
' op': 72,
|
||||||
|
'e t': 73,
|
||||||
|
'ngs': 74,
|
||||||
|
'se ': 75,
|
||||||
|
'end': 76,
|
||||||
|
'uit': 77,
|
||||||
|
' st': 78,
|
||||||
|
' le': 79,
|
||||||
|
'ens': 80,
|
||||||
|
'ter': 81,
|
||||||
|
' re': 82,
|
||||||
|
'e a': 83,
|
||||||
|
'ies': 84,
|
||||||
|
'wor': 85,
|
||||||
|
'g v': 86,
|
||||||
|
'sta': 87,
|
||||||
|
'n s': 88,
|
||||||
|
' na': 89,
|
||||||
|
' pr': 90,
|
||||||
|
'n o': 91,
|
||||||
|
' me': 92,
|
||||||
|
'al ': 93,
|
||||||
|
'of ': 94,
|
||||||
|
' vi': 95,
|
||||||
|
'erd': 96,
|
||||||
|
'lee': 97,
|
||||||
|
'e k': 98,
|
||||||
|
' de': 99,
|
||||||
|
'ite': 100,
|
||||||
|
'erk': 101,
|
||||||
|
'ik ': 102,
|
||||||
|
'e r': 103,
|
||||||
|
'e p': 104,
|
||||||
|
'n v': 105,
|
||||||
|
'e i': 106,
|
||||||
|
'e n': 107,
|
||||||
|
'een': 108,
|
||||||
|
'eli': 109,
|
||||||
|
'wer': 110,
|
||||||
|
' of': 111,
|
||||||
|
' da': 112,
|
||||||
|
'tel': 113,
|
||||||
|
'nie': 114,
|
||||||
|
'ike': 115,
|
||||||
|
's e': 116,
|
||||||
|
'taa': 117,
|
||||||
|
'ge ': 118,
|
||||||
|
'vir': 119,
|
||||||
|
'hei': 120,
|
||||||
|
'ir ': 121,
|
||||||
|
'reg': 122,
|
||||||
|
'ede': 123,
|
||||||
|
's v': 124,
|
||||||
|
'ur ': 125,
|
||||||
|
'pro': 126,
|
||||||
|
'ele': 127,
|
||||||
|
'ion': 128,
|
||||||
|
'wet': 129,
|
||||||
|
'e l': 130,
|
||||||
|
' mo': 131,
|
||||||
|
'e m': 132,
|
||||||
|
'daa': 133,
|
||||||
|
'sio': 134,
|
||||||
|
's d': 135,
|
||||||
|
' he': 136,
|
||||||
|
' to': 137,
|
||||||
|
'ent': 138,
|
||||||
|
'ard': 139,
|
||||||
|
'nge': 140,
|
||||||
|
' oo': 141,
|
||||||
|
'eur': 142,
|
||||||
|
'lle': 143,
|
||||||
|
'ien': 144,
|
||||||
|
'n b': 145,
|
||||||
|
'eke': 146,
|
||||||
|
'lin': 147,
|
||||||
|
'raa': 148,
|
||||||
|
' ni': 149,
|
||||||
|
'ont': 150,
|
||||||
|
'bes': 151,
|
||||||
|
'rdi': 152,
|
||||||
|
'voo': 153,
|
||||||
|
'ns ': 154,
|
||||||
|
'n a': 155,
|
||||||
|
'del': 156,
|
||||||
|
'dig': 157,
|
||||||
|
'nas': 158,
|
||||||
|
' sa': 159,
|
||||||
|
' gr': 160,
|
||||||
|
'nis': 161,
|
||||||
|
'kom': 162,
|
||||||
|
' ui': 163,
|
||||||
|
'men': 164,
|
||||||
|
'op ': 165,
|
||||||
|
'ins': 166,
|
||||||
|
'ona': 167,
|
||||||
|
'ere': 168,
|
||||||
|
's o': 169,
|
||||||
|
' so': 170,
|
||||||
|
'n g': 171,
|
||||||
|
'ig ': 172,
|
||||||
|
'moe': 173,
|
||||||
|
' ko': 174,
|
||||||
|
'rs ': 175,
|
||||||
|
'ges': 176,
|
||||||
|
'nal': 177,
|
||||||
|
'vol': 178,
|
||||||
|
'e h': 179,
|
||||||
|
'geb': 180,
|
||||||
|
'rui': 181,
|
||||||
|
'ang': 182,
|
||||||
|
'ige': 183,
|
||||||
|
'oet': 184,
|
||||||
|
'ar ': 185,
|
||||||
|
'wys': 186,
|
||||||
|
'lig': 187,
|
||||||
|
'as ': 188,
|
||||||
|
'n w': 189,
|
||||||
|
' as': 190,
|
||||||
|
'met': 191,
|
||||||
|
'gs ': 192,
|
||||||
|
'deu': 193,
|
||||||
|
't v': 194,
|
||||||
|
'aal': 195,
|
||||||
|
'erw': 196,
|
||||||
|
'dit': 197,
|
||||||
|
'ken': 198,
|
||||||
|
'sse': 199,
|
||||||
|
'kel': 200,
|
||||||
|
' hu': 201,
|
||||||
|
'ewe': 202,
|
||||||
|
'din': 203,
|
||||||
|
'n t': 204,
|
||||||
|
' se': 205,
|
||||||
|
'est': 206,
|
||||||
|
'ika': 207,
|
||||||
|
'n p': 208,
|
||||||
|
'ntw': 209,
|
||||||
|
't i': 210,
|
||||||
|
'eni': 211,
|
||||||
|
' ka': 212,
|
||||||
|
'n e': 213,
|
||||||
|
'doe': 214,
|
||||||
|
'ali': 215,
|
||||||
|
'eme': 216,
|
||||||
|
'gro': 217,
|
||||||
|
'nte': 218,
|
||||||
|
' ho': 219,
|
||||||
|
'nsi': 220,
|
||||||
|
'gen': 221,
|
||||||
|
'ier': 222,
|
||||||
|
'gew': 223,
|
||||||
|
'n h': 224,
|
||||||
|
'or ': 225,
|
||||||
|
' ma': 226,
|
||||||
|
'ind': 227,
|
||||||
|
'ne ': 228,
|
||||||
|
'ek ': 229,
|
||||||
|
'aat': 230,
|
||||||
|
"n '": 231,
|
||||||
|
' sk': 232,
|
||||||
|
'ide': 233,
|
||||||
|
' ta': 234,
|
||||||
|
'dat': 235,
|
||||||
|
'ska': 236,
|
||||||
|
'ger': 237,
|
||||||
|
'soo': 238,
|
||||||
|
'n k': 239,
|
||||||
|
's i': 240,
|
||||||
|
' af': 241,
|
||||||
|
'tee': 242,
|
||||||
|
'nd ': 243,
|
||||||
|
'eel': 244,
|
||||||
|
'hul': 245,
|
||||||
|
'nee': 246,
|
||||||
|
'woo': 247,
|
||||||
|
'rik': 248,
|
||||||
|
'd v': 249,
|
||||||
|
'n m': 250,
|
||||||
|
're ': 251,
|
||||||
|
'art': 252,
|
||||||
|
'ebr': 253,
|
||||||
|
'lan': 254,
|
||||||
|
'kke': 255,
|
||||||
|
'ron': 256,
|
||||||
|
'aam': 257,
|
||||||
|
'tre': 258,
|
||||||
|
'str': 259,
|
||||||
|
'kan': 260,
|
||||||
|
'ree': 261,
|
||||||
|
'lei': 262,
|
||||||
|
't o': 263,
|
||||||
|
'gra': 264,
|
||||||
|
'het': 265,
|
||||||
|
'evo': 266,
|
||||||
|
'tan': 267,
|
||||||
|
'den': 268,
|
||||||
|
'ist': 269,
|
||||||
|
' do': 270,
|
||||||
|
'bru': 271,
|
||||||
|
'toe': 272,
|
||||||
|
'olg': 273,
|
||||||
|
'rsk': 274,
|
||||||
|
'uik': 275,
|
||||||
|
'rwy': 276,
|
||||||
|
'min': 277,
|
||||||
|
'lge': 278,
|
||||||
|
'g e': 279,
|
||||||
|
'g o': 280,
|
||||||
|
'nst': 281,
|
||||||
|
'r v': 282,
|
||||||
|
'gte': 283,
|
||||||
|
'waa': 284,
|
||||||
|
'we ': 285,
|
||||||
|
'ans': 286,
|
||||||
|
'esi': 287,
|
||||||
|
'ese': 288,
|
||||||
|
'voe': 289,
|
||||||
|
'epa': 290,
|
||||||
|
'gel': 291,
|
||||||
|
' hi': 292,
|
||||||
|
'vin': 293,
|
||||||
|
'nse': 294,
|
||||||
|
's w': 295,
|
||||||
|
's t': 296,
|
||||||
|
'tei': 297,
|
||||||
|
'eit': 298,
|
||||||
|
'pre': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/ar.py
Normal file
303
libs/guess_language/data/models/ar.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
' ال': 0,
|
||||||
|
'الع': 1,
|
||||||
|
'لعر': 2,
|
||||||
|
'عرا': 3,
|
||||||
|
'راق': 4,
|
||||||
|
' في': 5,
|
||||||
|
'في ': 6,
|
||||||
|
'ين ': 7,
|
||||||
|
'ية ': 8,
|
||||||
|
'ن ا': 9,
|
||||||
|
'الم': 10,
|
||||||
|
'ات ': 11,
|
||||||
|
'من ': 12,
|
||||||
|
'ي ا': 13,
|
||||||
|
' من': 14,
|
||||||
|
'الأ': 15,
|
||||||
|
'ة ا': 16,
|
||||||
|
'اق ': 17,
|
||||||
|
' وا': 18,
|
||||||
|
'اء ': 19,
|
||||||
|
'الإ': 20,
|
||||||
|
' أن': 21,
|
||||||
|
'وال': 22,
|
||||||
|
'ما ': 23,
|
||||||
|
' عل': 24,
|
||||||
|
'لى ': 25,
|
||||||
|
'ت ا': 26,
|
||||||
|
'ون ': 27,
|
||||||
|
'هم ': 28,
|
||||||
|
'اقي': 29,
|
||||||
|
'ام ': 30,
|
||||||
|
'ل ا': 31,
|
||||||
|
'أن ': 32,
|
||||||
|
'م ا': 33,
|
||||||
|
'الت': 34,
|
||||||
|
'لا ': 35,
|
||||||
|
'الا': 36,
|
||||||
|
'ان ': 37,
|
||||||
|
'ها ': 38,
|
||||||
|
'ال ': 39,
|
||||||
|
'ة و': 40,
|
||||||
|
'ا ا': 41,
|
||||||
|
'رها': 42,
|
||||||
|
'لام': 43,
|
||||||
|
'يين': 44,
|
||||||
|
' ول': 45,
|
||||||
|
'لأم': 46,
|
||||||
|
'نا ': 47,
|
||||||
|
'على': 48,
|
||||||
|
'ن ي': 49,
|
||||||
|
'الب': 50,
|
||||||
|
'اد ': 51,
|
||||||
|
'الق': 52,
|
||||||
|
'د ا': 53,
|
||||||
|
'ذا ': 54,
|
||||||
|
'ه ا': 55,
|
||||||
|
' با': 56,
|
||||||
|
'الد': 57,
|
||||||
|
'ب ا': 58,
|
||||||
|
'مري': 59,
|
||||||
|
'لم ': 60,
|
||||||
|
' إن': 61,
|
||||||
|
' لل': 62,
|
||||||
|
'سلا': 63,
|
||||||
|
'أمر': 64,
|
||||||
|
'ريك': 65,
|
||||||
|
'مة ': 66,
|
||||||
|
'ى ا': 67,
|
||||||
|
'ا ي': 68,
|
||||||
|
' عن': 69,
|
||||||
|
' هذ': 70,
|
||||||
|
'ء ا': 71,
|
||||||
|
'ر ا': 72,
|
||||||
|
'كان': 73,
|
||||||
|
'قتل': 74,
|
||||||
|
'إسل': 75,
|
||||||
|
'الح': 76,
|
||||||
|
'وا ': 77,
|
||||||
|
' إل': 78,
|
||||||
|
'ا أ': 79,
|
||||||
|
'بال': 80,
|
||||||
|
'ن م': 81,
|
||||||
|
'الس': 82,
|
||||||
|
'رة ': 83,
|
||||||
|
'لإس': 84,
|
||||||
|
'ن و': 85,
|
||||||
|
'هاب': 86,
|
||||||
|
'ي و': 87,
|
||||||
|
'ير ': 88,
|
||||||
|
' كا': 89,
|
||||||
|
'لة ': 90,
|
||||||
|
'يات': 91,
|
||||||
|
' لا': 92,
|
||||||
|
'انت': 93,
|
||||||
|
'ن أ': 94,
|
||||||
|
'يكي': 95,
|
||||||
|
'الر': 96,
|
||||||
|
'الو': 97,
|
||||||
|
'ة ف': 98,
|
||||||
|
'دة ': 99,
|
||||||
|
'الج': 100,
|
||||||
|
'قي ': 101,
|
||||||
|
'وي ': 102,
|
||||||
|
'الذ': 103,
|
||||||
|
'الش': 104,
|
||||||
|
'امي': 105,
|
||||||
|
'اني': 106,
|
||||||
|
'ذه ': 107,
|
||||||
|
'عن ': 108,
|
||||||
|
'لما': 109,
|
||||||
|
'هذه': 110,
|
||||||
|
'ول ': 111,
|
||||||
|
'اف ': 112,
|
||||||
|
'اوي': 113,
|
||||||
|
'بري': 114,
|
||||||
|
'ة ل': 115,
|
||||||
|
' أم': 116,
|
||||||
|
' لم': 117,
|
||||||
|
' ما': 118,
|
||||||
|
'يد ': 119,
|
||||||
|
' أي': 120,
|
||||||
|
'إره': 121,
|
||||||
|
'ع ا': 122,
|
||||||
|
'عمل': 123,
|
||||||
|
'ولا': 124,
|
||||||
|
'إلى': 125,
|
||||||
|
'ابي': 126,
|
||||||
|
'ن ف': 127,
|
||||||
|
'ختط': 128,
|
||||||
|
'لك ': 129,
|
||||||
|
'نه ': 130,
|
||||||
|
'ني ': 131,
|
||||||
|
'إن ': 132,
|
||||||
|
'دين': 133,
|
||||||
|
'ف ا': 134,
|
||||||
|
'لذي': 135,
|
||||||
|
'ي أ': 136,
|
||||||
|
'ي ب': 137,
|
||||||
|
' وأ': 138,
|
||||||
|
'ا ع': 139,
|
||||||
|
'الخ': 140,
|
||||||
|
'تل ': 141,
|
||||||
|
'تي ': 142,
|
||||||
|
'قد ': 143,
|
||||||
|
'لدي': 144,
|
||||||
|
' كل': 145,
|
||||||
|
' مع': 146,
|
||||||
|
'اب ': 147,
|
||||||
|
'اخت': 148,
|
||||||
|
'ار ': 149,
|
||||||
|
'الن': 150,
|
||||||
|
'علا': 151,
|
||||||
|
'م و': 152,
|
||||||
|
'مع ': 153,
|
||||||
|
'س ا': 154,
|
||||||
|
'كل ': 155,
|
||||||
|
'لاء': 156,
|
||||||
|
'ن ب': 157,
|
||||||
|
'ن ت': 158,
|
||||||
|
'ي م': 159,
|
||||||
|
'عرب': 160,
|
||||||
|
'م ب': 161,
|
||||||
|
' وق': 162,
|
||||||
|
' يق': 163,
|
||||||
|
'ا ل': 164,
|
||||||
|
'ا م': 165,
|
||||||
|
'الف': 166,
|
||||||
|
'تطا': 167,
|
||||||
|
'داد': 168,
|
||||||
|
'لمس': 169,
|
||||||
|
'له ': 170,
|
||||||
|
'هذا': 171,
|
||||||
|
' مح': 172,
|
||||||
|
'ؤلا': 173,
|
||||||
|
'بي ': 174,
|
||||||
|
'ة م': 175,
|
||||||
|
'ن ل': 176,
|
||||||
|
'هؤل': 177,
|
||||||
|
'كن ': 178,
|
||||||
|
'لإر': 179,
|
||||||
|
'لتي': 180,
|
||||||
|
' أو': 181,
|
||||||
|
' ان': 182,
|
||||||
|
' عم': 183,
|
||||||
|
'ا ف': 184,
|
||||||
|
'ة أ': 185,
|
||||||
|
'طاف': 186,
|
||||||
|
'عب ': 187,
|
||||||
|
'ل م': 188,
|
||||||
|
'ن ع': 189,
|
||||||
|
'ور ': 190,
|
||||||
|
'يا ': 191,
|
||||||
|
' يس': 192,
|
||||||
|
'ا ت': 193,
|
||||||
|
'ة ب': 194,
|
||||||
|
'راء': 195,
|
||||||
|
'عال': 196,
|
||||||
|
'قوا': 197,
|
||||||
|
'قية': 198,
|
||||||
|
'لعا': 199,
|
||||||
|
'م ي': 200,
|
||||||
|
'مي ': 201,
|
||||||
|
'مية': 202,
|
||||||
|
'نية': 203,
|
||||||
|
'أي ': 204,
|
||||||
|
'ابا': 205,
|
||||||
|
'بغد': 206,
|
||||||
|
'بل ': 207,
|
||||||
|
'رب ': 208,
|
||||||
|
'عما': 209,
|
||||||
|
'غدا': 210,
|
||||||
|
'مال': 211,
|
||||||
|
'ملي': 212,
|
||||||
|
'يس ': 213,
|
||||||
|
' بأ': 214,
|
||||||
|
' بع': 215,
|
||||||
|
' بغ': 216,
|
||||||
|
' وم': 217,
|
||||||
|
'بات': 218,
|
||||||
|
'بية': 219,
|
||||||
|
'ذلك': 220,
|
||||||
|
'عة ': 221,
|
||||||
|
'قاو': 222,
|
||||||
|
'قيي': 223,
|
||||||
|
'كي ': 224,
|
||||||
|
'م م': 225,
|
||||||
|
'ي ع': 226,
|
||||||
|
' عر': 227,
|
||||||
|
' قا': 228,
|
||||||
|
'ا و': 229,
|
||||||
|
'رى ': 230,
|
||||||
|
'ق ا': 231,
|
||||||
|
'وات': 232,
|
||||||
|
'وم ': 233,
|
||||||
|
' هؤ': 234,
|
||||||
|
'ا ب': 235,
|
||||||
|
'دام': 236,
|
||||||
|
'دي ': 237,
|
||||||
|
'رات': 238,
|
||||||
|
'شعب': 239,
|
||||||
|
'لان': 240,
|
||||||
|
'لشع': 241,
|
||||||
|
'لقو': 242,
|
||||||
|
'ليا': 243,
|
||||||
|
'ن ه': 244,
|
||||||
|
'ي ت': 245,
|
||||||
|
'ي ي': 246,
|
||||||
|
' وه': 247,
|
||||||
|
' يح': 248,
|
||||||
|
'جرا': 249,
|
||||||
|
'جما': 250,
|
||||||
|
'حمد': 251,
|
||||||
|
'دم ': 252,
|
||||||
|
'كم ': 253,
|
||||||
|
'لاو': 254,
|
||||||
|
'لره': 255,
|
||||||
|
'ماع': 256,
|
||||||
|
'ن ق': 257,
|
||||||
|
'نة ': 258,
|
||||||
|
'هي ': 259,
|
||||||
|
' بل': 260,
|
||||||
|
' به': 261,
|
||||||
|
' له': 262,
|
||||||
|
' وي': 263,
|
||||||
|
'ا ك': 264,
|
||||||
|
'اذا': 265,
|
||||||
|
'اع ': 266,
|
||||||
|
'ت م': 267,
|
||||||
|
'تخا': 268,
|
||||||
|
'خاب': 269,
|
||||||
|
'ر م': 270,
|
||||||
|
'لمت': 271,
|
||||||
|
'مسل': 272,
|
||||||
|
'ى أ': 273,
|
||||||
|
'يست': 274,
|
||||||
|
'يطا': 275,
|
||||||
|
' لأ': 276,
|
||||||
|
' لي': 277,
|
||||||
|
'أمن': 278,
|
||||||
|
'است': 279,
|
||||||
|
'بعض': 280,
|
||||||
|
'ة ت': 281,
|
||||||
|
'ري ': 282,
|
||||||
|
'صدا': 283,
|
||||||
|
'ق و': 284,
|
||||||
|
'قول': 285,
|
||||||
|
'مد ': 286,
|
||||||
|
'نتخ': 287,
|
||||||
|
'نفس': 288,
|
||||||
|
'نها': 289,
|
||||||
|
'هنا': 290,
|
||||||
|
'أعم': 291,
|
||||||
|
'أنه': 292,
|
||||||
|
'ائن': 293,
|
||||||
|
'الآ': 294,
|
||||||
|
'الك': 295,
|
||||||
|
'حة ': 296,
|
||||||
|
'د م': 297,
|
||||||
|
'ر ع': 298,
|
||||||
|
'ربي': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/az.py
Normal file
303
libs/guess_language/data/models/az.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'lər': 0,
|
||||||
|
'in ': 1,
|
||||||
|
'ın ': 2,
|
||||||
|
'lar': 3,
|
||||||
|
'da ': 4,
|
||||||
|
'an ': 5,
|
||||||
|
'ir ': 6,
|
||||||
|
'də ': 7,
|
||||||
|
'ki ': 8,
|
||||||
|
' bi': 9,
|
||||||
|
'ən ': 10,
|
||||||
|
'əri': 11,
|
||||||
|
'arı': 12,
|
||||||
|
'ər ': 13,
|
||||||
|
'dir': 14,
|
||||||
|
'nda': 15,
|
||||||
|
' ki': 16,
|
||||||
|
'rin': 17,
|
||||||
|
'nın': 18,
|
||||||
|
'əsi': 19,
|
||||||
|
'ini': 20,
|
||||||
|
' ed': 21,
|
||||||
|
' qa': 22,
|
||||||
|
' tə': 23,
|
||||||
|
' ba': 24,
|
||||||
|
' ol': 25,
|
||||||
|
'ası': 26,
|
||||||
|
'ilə': 27,
|
||||||
|
'rın': 28,
|
||||||
|
' ya': 29,
|
||||||
|
'anı': 30,
|
||||||
|
' və': 31,
|
||||||
|
'ndə': 32,
|
||||||
|
'ni ': 33,
|
||||||
|
'ara': 34,
|
||||||
|
'ını': 35,
|
||||||
|
'ınd': 36,
|
||||||
|
' bu': 37,
|
||||||
|
'si ': 38,
|
||||||
|
'ib ': 39,
|
||||||
|
'aq ': 40,
|
||||||
|
'dən': 41,
|
||||||
|
'iya': 42,
|
||||||
|
'nə ': 43,
|
||||||
|
'rə ': 44,
|
||||||
|
'n b': 45,
|
||||||
|
'sın': 46,
|
||||||
|
'və ': 47,
|
||||||
|
'iri': 48,
|
||||||
|
'lə ': 49,
|
||||||
|
'nin': 50,
|
||||||
|
'əli': 51,
|
||||||
|
' de': 52,
|
||||||
|
' mü': 53,
|
||||||
|
'bir': 54,
|
||||||
|
'n s': 55,
|
||||||
|
'ri ': 56,
|
||||||
|
'ək ': 57,
|
||||||
|
' az': 58,
|
||||||
|
' sə': 59,
|
||||||
|
'ar ': 60,
|
||||||
|
'bil': 61,
|
||||||
|
'zər': 62,
|
||||||
|
'bu ': 63,
|
||||||
|
'dan': 64,
|
||||||
|
'edi': 65,
|
||||||
|
'ind': 66,
|
||||||
|
'man': 67,
|
||||||
|
'un ': 68,
|
||||||
|
'ərə': 69,
|
||||||
|
' ha': 70,
|
||||||
|
'lan': 71,
|
||||||
|
'yyə': 72,
|
||||||
|
'iyy': 73,
|
||||||
|
' il': 74,
|
||||||
|
' ne': 75,
|
||||||
|
'r k': 76,
|
||||||
|
'ə b': 77,
|
||||||
|
' is': 78,
|
||||||
|
'na ': 79,
|
||||||
|
'nun': 80,
|
||||||
|
'ır ': 81,
|
||||||
|
' da': 82,
|
||||||
|
' hə': 83,
|
||||||
|
'a b': 84,
|
||||||
|
'inə': 85,
|
||||||
|
'sin': 86,
|
||||||
|
'yan': 87,
|
||||||
|
'ərb': 88,
|
||||||
|
' də': 89,
|
||||||
|
' mə': 90,
|
||||||
|
' qə': 91,
|
||||||
|
'dır': 92,
|
||||||
|
'li ': 93,
|
||||||
|
'ola': 94,
|
||||||
|
'rba': 95,
|
||||||
|
'azə': 96,
|
||||||
|
'can': 97,
|
||||||
|
'lı ': 98,
|
||||||
|
'nla': 99,
|
||||||
|
' et': 100,
|
||||||
|
' gö': 101,
|
||||||
|
'alı': 102,
|
||||||
|
'ayc': 103,
|
||||||
|
'bay': 104,
|
||||||
|
'eft': 105,
|
||||||
|
'ist': 106,
|
||||||
|
'n i': 107,
|
||||||
|
'nef': 108,
|
||||||
|
'tlə': 109,
|
||||||
|
'yca': 110,
|
||||||
|
'yət': 111,
|
||||||
|
'əcə': 112,
|
||||||
|
' la': 113,
|
||||||
|
'ild': 114,
|
||||||
|
'nı ': 115,
|
||||||
|
'tin': 116,
|
||||||
|
'ldi': 117,
|
||||||
|
'lik': 118,
|
||||||
|
'n h': 119,
|
||||||
|
'n m': 120,
|
||||||
|
'oyu': 121,
|
||||||
|
'raq': 122,
|
||||||
|
'ya ': 123,
|
||||||
|
'əti': 124,
|
||||||
|
' ar': 125,
|
||||||
|
'ada': 126,
|
||||||
|
'edə': 127,
|
||||||
|
'mas': 128,
|
||||||
|
'sı ': 129,
|
||||||
|
'ına': 130,
|
||||||
|
'ə d': 131,
|
||||||
|
'ələ': 132,
|
||||||
|
'ayı': 133,
|
||||||
|
'iyi': 134,
|
||||||
|
'lma': 135,
|
||||||
|
'mək': 136,
|
||||||
|
'n d': 137,
|
||||||
|
'ti ': 138,
|
||||||
|
'yin': 139,
|
||||||
|
'yun': 140,
|
||||||
|
'ət ': 141,
|
||||||
|
'azı': 142,
|
||||||
|
'ft ': 143,
|
||||||
|
'i t': 144,
|
||||||
|
'lli': 145,
|
||||||
|
'n a': 146,
|
||||||
|
'ra ': 147,
|
||||||
|
' cə': 148,
|
||||||
|
' gə': 149,
|
||||||
|
' ko': 150,
|
||||||
|
' nə': 151,
|
||||||
|
' oy': 152,
|
||||||
|
'a d': 153,
|
||||||
|
'ana': 154,
|
||||||
|
'cək': 155,
|
||||||
|
'eyi': 156,
|
||||||
|
'ilm': 157,
|
||||||
|
'irl': 158,
|
||||||
|
'lay': 159,
|
||||||
|
'liy': 160,
|
||||||
|
'lub': 161,
|
||||||
|
'n ə': 162,
|
||||||
|
'ril': 163,
|
||||||
|
'rlə': 164,
|
||||||
|
'unu': 165,
|
||||||
|
'ver': 166,
|
||||||
|
'ün ': 167,
|
||||||
|
'ə o': 168,
|
||||||
|
'əni': 169,
|
||||||
|
' he': 170,
|
||||||
|
' ma': 171,
|
||||||
|
' on': 172,
|
||||||
|
' pa': 173,
|
||||||
|
'ala': 174,
|
||||||
|
'dey': 175,
|
||||||
|
'i m': 176,
|
||||||
|
'ima': 177,
|
||||||
|
'lmə': 178,
|
||||||
|
'mət': 179,
|
||||||
|
'par': 180,
|
||||||
|
'yə ': 181,
|
||||||
|
'ətl': 182,
|
||||||
|
' al': 183,
|
||||||
|
' mi': 184,
|
||||||
|
' sa': 185,
|
||||||
|
' əl': 186,
|
||||||
|
'adı': 187,
|
||||||
|
'akı': 188,
|
||||||
|
'and': 189,
|
||||||
|
'ard': 190,
|
||||||
|
'art': 191,
|
||||||
|
'ayi': 192,
|
||||||
|
'i a': 193,
|
||||||
|
'i q': 194,
|
||||||
|
'i y': 195,
|
||||||
|
'ili': 196,
|
||||||
|
'ill': 197,
|
||||||
|
'isə': 198,
|
||||||
|
'n o': 199,
|
||||||
|
'n q': 200,
|
||||||
|
'olu': 201,
|
||||||
|
'rla': 202,
|
||||||
|
'stə': 203,
|
||||||
|
'sə ': 204,
|
||||||
|
'tan': 205,
|
||||||
|
'tel': 206,
|
||||||
|
'yar': 207,
|
||||||
|
'ədə': 208,
|
||||||
|
' me': 209,
|
||||||
|
' rə': 210,
|
||||||
|
' ve': 211,
|
||||||
|
' ye': 212,
|
||||||
|
'a k': 213,
|
||||||
|
'at ': 214,
|
||||||
|
'baş': 215,
|
||||||
|
'diy': 216,
|
||||||
|
'ent': 217,
|
||||||
|
'eti': 218,
|
||||||
|
'həs': 219,
|
||||||
|
'i i': 220,
|
||||||
|
'ik ': 221,
|
||||||
|
'la ': 222,
|
||||||
|
'miş': 223,
|
||||||
|
'n n': 224,
|
||||||
|
'nu ': 225,
|
||||||
|
'qar': 226,
|
||||||
|
'ran': 227,
|
||||||
|
'tər': 228,
|
||||||
|
'xan': 229,
|
||||||
|
'ə a': 230,
|
||||||
|
'ə g': 231,
|
||||||
|
'ə t': 232,
|
||||||
|
' dü': 233,
|
||||||
|
'ama': 234,
|
||||||
|
'b k': 235,
|
||||||
|
'dil': 236,
|
||||||
|
'era': 237,
|
||||||
|
'etm': 238,
|
||||||
|
'i b': 239,
|
||||||
|
'kil': 240,
|
||||||
|
'mil': 241,
|
||||||
|
'n r': 242,
|
||||||
|
'qla': 243,
|
||||||
|
'r s': 244,
|
||||||
|
'ras': 245,
|
||||||
|
'siy': 246,
|
||||||
|
'son': 247,
|
||||||
|
'tim': 248,
|
||||||
|
'yer': 249,
|
||||||
|
'ə k': 250,
|
||||||
|
' gü': 251,
|
||||||
|
' so': 252,
|
||||||
|
' sö': 253,
|
||||||
|
' te': 254,
|
||||||
|
' xa': 255,
|
||||||
|
'ai ': 256,
|
||||||
|
'bar': 257,
|
||||||
|
'cti': 258,
|
||||||
|
'di ': 259,
|
||||||
|
'eri': 260,
|
||||||
|
'gör': 261,
|
||||||
|
'gün': 262,
|
||||||
|
'gəl': 263,
|
||||||
|
'hbə': 264,
|
||||||
|
'ihə': 265,
|
||||||
|
'iki': 266,
|
||||||
|
'isi': 267,
|
||||||
|
'lin': 268,
|
||||||
|
'mai': 269,
|
||||||
|
'maq': 270,
|
||||||
|
'n k': 271,
|
||||||
|
'n t': 272,
|
||||||
|
'n v': 273,
|
||||||
|
'onu': 274,
|
||||||
|
'qan': 275,
|
||||||
|
'qəz': 276,
|
||||||
|
'tə ': 277,
|
||||||
|
'xal': 278,
|
||||||
|
'yib': 279,
|
||||||
|
'yih': 280,
|
||||||
|
'zet': 281,
|
||||||
|
'zır': 282,
|
||||||
|
'ıb ': 283,
|
||||||
|
'ə m': 284,
|
||||||
|
'əze': 285,
|
||||||
|
' br': 286,
|
||||||
|
' in': 287,
|
||||||
|
' ir': 288,
|
||||||
|
' pr': 289,
|
||||||
|
' ta': 290,
|
||||||
|
' to': 291,
|
||||||
|
' üç': 292,
|
||||||
|
'a o': 293,
|
||||||
|
'ali': 294,
|
||||||
|
'ani': 295,
|
||||||
|
'anl': 296,
|
||||||
|
'aql': 297,
|
||||||
|
'azi': 298,
|
||||||
|
'bri': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/bg.py
Normal file
303
libs/guess_language/data/models/bg.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'на ': 0,
|
||||||
|
' на': 1,
|
||||||
|
'то ': 2,
|
||||||
|
' пр': 3,
|
||||||
|
' за': 4,
|
||||||
|
'та ': 5,
|
||||||
|
' по': 6,
|
||||||
|
'ите': 7,
|
||||||
|
'те ': 8,
|
||||||
|
'а п': 9,
|
||||||
|
'а с': 10,
|
||||||
|
' от': 11,
|
||||||
|
'за ': 12,
|
||||||
|
'ата': 13,
|
||||||
|
'ия ': 14,
|
||||||
|
' в ': 15,
|
||||||
|
'е н': 16,
|
||||||
|
' да': 17,
|
||||||
|
'а н': 18,
|
||||||
|
' се': 19,
|
||||||
|
' ко': 20,
|
||||||
|
'да ': 21,
|
||||||
|
'от ': 22,
|
||||||
|
'ани': 23,
|
||||||
|
'пре': 24,
|
||||||
|
'не ': 25,
|
||||||
|
'ени': 26,
|
||||||
|
'о н': 27,
|
||||||
|
'ни ': 28,
|
||||||
|
'се ': 29,
|
||||||
|
' и ': 30,
|
||||||
|
'но ': 31,
|
||||||
|
'ане': 32,
|
||||||
|
'ето': 33,
|
||||||
|
'а в': 34,
|
||||||
|
'ва ': 35,
|
||||||
|
'ван': 36,
|
||||||
|
'е п': 37,
|
||||||
|
'а о': 38,
|
||||||
|
'ото': 39,
|
||||||
|
'ран': 40,
|
||||||
|
'ат ': 41,
|
||||||
|
'ред': 42,
|
||||||
|
' не': 43,
|
||||||
|
'а д': 44,
|
||||||
|
'и п': 45,
|
||||||
|
' до': 46,
|
||||||
|
'про': 47,
|
||||||
|
' съ': 48,
|
||||||
|
'ли ': 49,
|
||||||
|
'при': 50,
|
||||||
|
'ния': 51,
|
||||||
|
'ски': 52,
|
||||||
|
'тел': 53,
|
||||||
|
'а и': 54,
|
||||||
|
'по ': 55,
|
||||||
|
'ри ': 56,
|
||||||
|
' е ': 57,
|
||||||
|
' ка': 58,
|
||||||
|
'ира': 59,
|
||||||
|
'кат': 60,
|
||||||
|
'ние': 61,
|
||||||
|
'нит': 62,
|
||||||
|
'е з': 63,
|
||||||
|
'и с': 64,
|
||||||
|
'о с': 65,
|
||||||
|
'ост': 66,
|
||||||
|
'че ': 67,
|
||||||
|
' ра': 68,
|
||||||
|
'ист': 69,
|
||||||
|
'о п': 70,
|
||||||
|
' из': 71,
|
||||||
|
' са': 72,
|
||||||
|
'е д': 73,
|
||||||
|
'ини': 74,
|
||||||
|
'ки ': 75,
|
||||||
|
'мин': 76,
|
||||||
|
' ми': 77,
|
||||||
|
'а б': 78,
|
||||||
|
'ава': 79,
|
||||||
|
'е в': 80,
|
||||||
|
'ие ': 81,
|
||||||
|
'пол': 82,
|
||||||
|
'ств': 83,
|
||||||
|
'т н': 84,
|
||||||
|
' въ': 85,
|
||||||
|
' ст': 86,
|
||||||
|
' то': 87,
|
||||||
|
'аза': 88,
|
||||||
|
'е о': 89,
|
||||||
|
'ов ': 90,
|
||||||
|
'ст ': 91,
|
||||||
|
'ът ': 92,
|
||||||
|
'и н': 93,
|
||||||
|
'ият': 94,
|
||||||
|
'нат': 95,
|
||||||
|
'ра ': 96,
|
||||||
|
' бъ': 97,
|
||||||
|
' че': 98,
|
||||||
|
'алн': 99,
|
||||||
|
'е с': 100,
|
||||||
|
'ен ': 101,
|
||||||
|
'ест': 102,
|
||||||
|
'и д': 103,
|
||||||
|
'лен': 104,
|
||||||
|
'нис': 105,
|
||||||
|
'о о': 106,
|
||||||
|
'ови': 107,
|
||||||
|
' об': 108,
|
||||||
|
' сл': 109,
|
||||||
|
'а р': 110,
|
||||||
|
'ато': 111,
|
||||||
|
'кон': 112,
|
||||||
|
'нос': 113,
|
||||||
|
'ров': 114,
|
||||||
|
'ще ': 115,
|
||||||
|
' ре': 116,
|
||||||
|
' с ': 117,
|
||||||
|
' сп': 118,
|
||||||
|
'ват': 119,
|
||||||
|
'еше': 120,
|
||||||
|
'и в': 121,
|
||||||
|
'иет': 122,
|
||||||
|
'о в': 123,
|
||||||
|
'ове': 124,
|
||||||
|
'ста': 125,
|
||||||
|
'а к': 126,
|
||||||
|
'а т': 127,
|
||||||
|
'дат': 128,
|
||||||
|
'ент': 129,
|
||||||
|
'ка ': 130,
|
||||||
|
'лед': 131,
|
||||||
|
'нет': 132,
|
||||||
|
'ори': 133,
|
||||||
|
'стр': 134,
|
||||||
|
'стъ': 135,
|
||||||
|
'ти ': 136,
|
||||||
|
'тър': 137,
|
||||||
|
' те': 138,
|
||||||
|
'а з': 139,
|
||||||
|
'а м': 140,
|
||||||
|
'ад ': 141,
|
||||||
|
'ана': 142,
|
||||||
|
'ено': 143,
|
||||||
|
'и о': 144,
|
||||||
|
'ина': 145,
|
||||||
|
'ити': 146,
|
||||||
|
'ма ': 147,
|
||||||
|
'ска': 148,
|
||||||
|
'сле': 149,
|
||||||
|
'тво': 150,
|
||||||
|
'тер': 151,
|
||||||
|
'ция': 152,
|
||||||
|
'ят ': 153,
|
||||||
|
' бе': 154,
|
||||||
|
' де': 155,
|
||||||
|
' па': 156,
|
||||||
|
'ате': 157,
|
||||||
|
'вен': 158,
|
||||||
|
'ви ': 159,
|
||||||
|
'вит': 160,
|
||||||
|
'и з': 161,
|
||||||
|
'и и': 162,
|
||||||
|
'нар': 163,
|
||||||
|
'нов': 164,
|
||||||
|
'ова': 165,
|
||||||
|
'пов': 166,
|
||||||
|
'рез': 167,
|
||||||
|
'рит': 168,
|
||||||
|
'са ': 169,
|
||||||
|
'ята': 170,
|
||||||
|
' го': 171,
|
||||||
|
' ще': 172,
|
||||||
|
'али': 173,
|
||||||
|
'в п': 174,
|
||||||
|
'гра': 175,
|
||||||
|
'е и': 176,
|
||||||
|
'еди': 177,
|
||||||
|
'ели': 178,
|
||||||
|
'или': 179,
|
||||||
|
'каз': 180,
|
||||||
|
'кит': 181,
|
||||||
|
'лно': 182,
|
||||||
|
'мен': 183,
|
||||||
|
'оли': 184,
|
||||||
|
'раз': 185,
|
||||||
|
' ве': 186,
|
||||||
|
' гр': 187,
|
||||||
|
' им': 188,
|
||||||
|
' ме': 189,
|
||||||
|
' пъ': 190,
|
||||||
|
'ави': 191,
|
||||||
|
'ако': 192,
|
||||||
|
'ача': 193,
|
||||||
|
'вин': 194,
|
||||||
|
'во ': 195,
|
||||||
|
'гов': 196,
|
||||||
|
'дан': 197,
|
||||||
|
'ди ': 198,
|
||||||
|
'до ': 199,
|
||||||
|
'ед ': 200,
|
||||||
|
'ери': 201,
|
||||||
|
'еро': 202,
|
||||||
|
'жда': 203,
|
||||||
|
'ито': 204,
|
||||||
|
'ков': 205,
|
||||||
|
'кол': 206,
|
||||||
|
'лни': 207,
|
||||||
|
'мер': 208,
|
||||||
|
'нач': 209,
|
||||||
|
'о з': 210,
|
||||||
|
'ола': 211,
|
||||||
|
'он ': 212,
|
||||||
|
'она': 213,
|
||||||
|
'пра': 214,
|
||||||
|
'рав': 215,
|
||||||
|
'рем': 216,
|
||||||
|
'сия': 217,
|
||||||
|
'сти': 218,
|
||||||
|
'т п': 219,
|
||||||
|
'тан': 220,
|
||||||
|
'ха ': 221,
|
||||||
|
'ше ': 222,
|
||||||
|
'шен': 223,
|
||||||
|
'ълг': 224,
|
||||||
|
' ба': 225,
|
||||||
|
' си': 226,
|
||||||
|
'аро': 227,
|
||||||
|
'бъл': 228,
|
||||||
|
'в р': 229,
|
||||||
|
'гар': 230,
|
||||||
|
'е е': 231,
|
||||||
|
'елн': 232,
|
||||||
|
'еме': 233,
|
||||||
|
'ико': 234,
|
||||||
|
'има': 235,
|
||||||
|
'ко ': 236,
|
||||||
|
'кои': 237,
|
||||||
|
'ла ': 238,
|
||||||
|
'лга': 239,
|
||||||
|
'о д': 240,
|
||||||
|
'ози': 241,
|
||||||
|
'оит': 242,
|
||||||
|
'под': 243,
|
||||||
|
'рес': 244,
|
||||||
|
'рие': 245,
|
||||||
|
'сто': 246,
|
||||||
|
'т к': 247,
|
||||||
|
'т м': 248,
|
||||||
|
'т с': 249,
|
||||||
|
'уст': 250,
|
||||||
|
' би': 251,
|
||||||
|
' дв': 252,
|
||||||
|
' дъ': 253,
|
||||||
|
' ма': 254,
|
||||||
|
' мо': 255,
|
||||||
|
' ни': 256,
|
||||||
|
' ос': 257,
|
||||||
|
'ала': 258,
|
||||||
|
'анс': 259,
|
||||||
|
'ара': 260,
|
||||||
|
'ати': 261,
|
||||||
|
'аци': 262,
|
||||||
|
'беш': 263,
|
||||||
|
'вър': 264,
|
||||||
|
'е р': 265,
|
||||||
|
'едв': 266,
|
||||||
|
'ема': 267,
|
||||||
|
'жав': 268,
|
||||||
|
'и к': 269,
|
||||||
|
'иал': 270,
|
||||||
|
'ица': 271,
|
||||||
|
'иче': 272,
|
||||||
|
'кия': 273,
|
||||||
|
'лит': 274,
|
||||||
|
'о б': 275,
|
||||||
|
'ово': 276,
|
||||||
|
'оди': 277,
|
||||||
|
'ока': 278,
|
||||||
|
'пос': 279,
|
||||||
|
'род': 280,
|
||||||
|
'сед': 281,
|
||||||
|
'слу': 282,
|
||||||
|
'т и': 283,
|
||||||
|
'тов': 284,
|
||||||
|
'ува': 285,
|
||||||
|
'циа': 286,
|
||||||
|
'чес': 287,
|
||||||
|
'я з': 288,
|
||||||
|
' во': 289,
|
||||||
|
' ил': 290,
|
||||||
|
' ск': 291,
|
||||||
|
' тр': 292,
|
||||||
|
' це': 293,
|
||||||
|
'ами': 294,
|
||||||
|
'ари': 295,
|
||||||
|
'бат': 296,
|
||||||
|
'би ': 297,
|
||||||
|
'бра': 298,
|
||||||
|
'бъд': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/ca.py
Normal file
303
libs/guess_language/data/models/ca.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
' de': 0,
|
||||||
|
'es ': 1,
|
||||||
|
'de ': 2,
|
||||||
|
'la ': 3,
|
||||||
|
' la': 4,
|
||||||
|
'el ': 5,
|
||||||
|
'que': 6,
|
||||||
|
' el': 7,
|
||||||
|
' co': 8,
|
||||||
|
'ent': 9,
|
||||||
|
's d': 10,
|
||||||
|
' qu': 11,
|
||||||
|
' i ': 12,
|
||||||
|
'en ': 13,
|
||||||
|
'er ': 14,
|
||||||
|
' a ': 15,
|
||||||
|
'ls ': 16,
|
||||||
|
'nt ': 17,
|
||||||
|
' pe': 18,
|
||||||
|
'e l': 19,
|
||||||
|
'a d': 20,
|
||||||
|
' en': 21,
|
||||||
|
'per': 22,
|
||||||
|
'ci ': 23,
|
||||||
|
'ar ': 24,
|
||||||
|
'ue ': 25,
|
||||||
|
'al ': 26,
|
||||||
|
' se': 27,
|
||||||
|
'est': 28,
|
||||||
|
'at ': 29,
|
||||||
|
' es': 30,
|
||||||
|
'ts ': 31,
|
||||||
|
' s ': 32,
|
||||||
|
' pr': 33,
|
||||||
|
'aci': 34,
|
||||||
|
' un': 35,
|
||||||
|
'res': 36,
|
||||||
|
'men': 37,
|
||||||
|
's e': 38,
|
||||||
|
'del': 39,
|
||||||
|
's a': 40,
|
||||||
|
's p': 41,
|
||||||
|
' re': 42,
|
||||||
|
'les': 43,
|
||||||
|
" l'": 44,
|
||||||
|
'na ': 45,
|
||||||
|
'a l': 46,
|
||||||
|
' ca': 47,
|
||||||
|
" d'": 48,
|
||||||
|
'els': 49,
|
||||||
|
'a p': 50,
|
||||||
|
'ia ': 51,
|
||||||
|
'ns ': 52,
|
||||||
|
'con': 53,
|
||||||
|
' le': 54,
|
||||||
|
'tat': 55,
|
||||||
|
'a c': 56,
|
||||||
|
'i d': 57,
|
||||||
|
'a a': 58,
|
||||||
|
'ra ': 59,
|
||||||
|
'a e': 60,
|
||||||
|
' no': 61,
|
||||||
|
'ant': 62,
|
||||||
|
' al': 63,
|
||||||
|
't d': 64,
|
||||||
|
's i': 65,
|
||||||
|
' di': 66,
|
||||||
|
'ta ': 67,
|
||||||
|
're ': 68,
|
||||||
|
'a s': 69,
|
||||||
|
'com': 70,
|
||||||
|
's c': 71,
|
||||||
|
'ita': 72,
|
||||||
|
'ons': 73,
|
||||||
|
'sta': 74,
|
||||||
|
'ica': 75,
|
||||||
|
' po': 76,
|
||||||
|
'r a': 77,
|
||||||
|
' in': 78,
|
||||||
|
'pro': 79,
|
||||||
|
'tre': 80,
|
||||||
|
' pa': 81,
|
||||||
|
'ues': 82,
|
||||||
|
'amb': 83,
|
||||||
|
'ion': 84,
|
||||||
|
'des': 85,
|
||||||
|
'un ': 86,
|
||||||
|
' ma': 87,
|
||||||
|
'da ': 88,
|
||||||
|
's s': 89,
|
||||||
|
'a i': 90,
|
||||||
|
'an ': 91,
|
||||||
|
'mb ': 92,
|
||||||
|
' am': 93,
|
||||||
|
'l d': 94,
|
||||||
|
'e d': 95,
|
||||||
|
'va ': 96,
|
||||||
|
'pre': 97,
|
||||||
|
'ter': 98,
|
||||||
|
'e e': 99,
|
||||||
|
'e c': 100,
|
||||||
|
'a m': 101,
|
||||||
|
'cia': 102,
|
||||||
|
'una': 103,
|
||||||
|
'i e': 104,
|
||||||
|
'nci': 105,
|
||||||
|
'tra': 106,
|
||||||
|
' te': 107,
|
||||||
|
'ona': 108,
|
||||||
|
'os ': 109,
|
||||||
|
't e': 110,
|
||||||
|
'n e': 111,
|
||||||
|
'l c': 112,
|
||||||
|
'ca ': 113,
|
||||||
|
'cio': 114,
|
||||||
|
'l p': 115,
|
||||||
|
' tr': 116,
|
||||||
|
'par': 117,
|
||||||
|
'r l': 118,
|
||||||
|
't a': 119,
|
||||||
|
'e p': 120,
|
||||||
|
'aqu': 121,
|
||||||
|
'nta': 122,
|
||||||
|
' so': 123,
|
||||||
|
'ame': 124,
|
||||||
|
'era': 125,
|
||||||
|
'r e': 126,
|
||||||
|
'e s': 127,
|
||||||
|
'ada': 128,
|
||||||
|
'n a': 129,
|
||||||
|
's q': 130,
|
||||||
|
' si': 131,
|
||||||
|
' ha': 132,
|
||||||
|
'als': 133,
|
||||||
|
'tes': 134,
|
||||||
|
' va': 135,
|
||||||
|
' m ': 136,
|
||||||
|
'ici': 137,
|
||||||
|
'nte': 138,
|
||||||
|
's l': 139,
|
||||||
|
's m': 140,
|
||||||
|
'i a': 141,
|
||||||
|
'or ': 142,
|
||||||
|
' mo': 143,
|
||||||
|
'ist': 144,
|
||||||
|
'ect': 145,
|
||||||
|
'lit': 146,
|
||||||
|
'm s': 147,
|
||||||
|
' to': 148,
|
||||||
|
'ir ': 149,
|
||||||
|
'a t': 150,
|
||||||
|
'esp': 151,
|
||||||
|
'ran': 152,
|
||||||
|
'str': 153,
|
||||||
|
'om ': 154,
|
||||||
|
'l s': 155,
|
||||||
|
'st ': 156,
|
||||||
|
'nts': 157,
|
||||||
|
' me': 158,
|
||||||
|
'no ': 159,
|
||||||
|
'r d': 160,
|
||||||
|
"d'a": 161,
|
||||||
|
"l'a": 162,
|
||||||
|
'ats': 163,
|
||||||
|
'ria': 164,
|
||||||
|
's t': 165,
|
||||||
|
' ta': 166,
|
||||||
|
'sen': 167,
|
||||||
|
'rs ': 168,
|
||||||
|
'eix': 169,
|
||||||
|
'tar': 170,
|
||||||
|
's n': 171,
|
||||||
|
'n l': 172,
|
||||||
|
'tal': 173,
|
||||||
|
'e a': 174,
|
||||||
|
't p': 175,
|
||||||
|
'art': 176,
|
||||||
|
' mi': 177,
|
||||||
|
' ll': 178,
|
||||||
|
'tic': 179,
|
||||||
|
'ten': 180,
|
||||||
|
'ser': 181,
|
||||||
|
' aq': 182,
|
||||||
|
'ina': 183,
|
||||||
|
'ntr': 184,
|
||||||
|
'a f': 185,
|
||||||
|
'sti': 186,
|
||||||
|
'ol ': 187,
|
||||||
|
'a q': 188,
|
||||||
|
'for': 189,
|
||||||
|
'ura': 190,
|
||||||
|
'ers': 191,
|
||||||
|
'ari': 192,
|
||||||
|
'int': 193,
|
||||||
|
'act': 194,
|
||||||
|
"l'e": 195,
|
||||||
|
' fi': 196,
|
||||||
|
'r s': 197,
|
||||||
|
'e t': 198,
|
||||||
|
'tor': 199,
|
||||||
|
'si ': 200,
|
||||||
|
'ste': 201,
|
||||||
|
'rec': 202,
|
||||||
|
'a r': 203,
|
||||||
|
' fe': 204,
|
||||||
|
'is ': 205,
|
||||||
|
'em ': 206,
|
||||||
|
'n d': 207,
|
||||||
|
'car': 208,
|
||||||
|
'bre': 209,
|
||||||
|
' fo': 210,
|
||||||
|
' vi': 211,
|
||||||
|
' an': 212,
|
||||||
|
'ali': 213,
|
||||||
|
'i p': 214,
|
||||||
|
'ix ': 215,
|
||||||
|
'ell': 216,
|
||||||
|
'l m': 217,
|
||||||
|
'pos': 218,
|
||||||
|
'orm': 219,
|
||||||
|
'l l': 220,
|
||||||
|
'i l': 221,
|
||||||
|
' ac': 222,
|
||||||
|
'fer': 223,
|
||||||
|
's r': 224,
|
||||||
|
'ess': 225,
|
||||||
|
'eu ': 226,
|
||||||
|
'e m': 227,
|
||||||
|
'ens': 228,
|
||||||
|
'ara': 229,
|
||||||
|
'eri': 230,
|
||||||
|
'sa ': 231,
|
||||||
|
'ssi': 232,
|
||||||
|
'us ': 233,
|
||||||
|
'ort': 234,
|
||||||
|
'tot': 235,
|
||||||
|
'll ': 236,
|
||||||
|
'por': 237,
|
||||||
|
'ora': 238,
|
||||||
|
' ci': 239,
|
||||||
|
'tan': 240,
|
||||||
|
'ass': 241,
|
||||||
|
'n c': 242,
|
||||||
|
'ost': 243,
|
||||||
|
'nes': 244,
|
||||||
|
'rac': 245,
|
||||||
|
'a u': 246,
|
||||||
|
'ver': 247,
|
||||||
|
'ont': 248,
|
||||||
|
'ha ': 249,
|
||||||
|
' ti': 250,
|
||||||
|
'itz': 251,
|
||||||
|
'gra': 252,
|
||||||
|
't c': 253,
|
||||||
|
' n ': 254,
|
||||||
|
'a v': 255,
|
||||||
|
'ren': 256,
|
||||||
|
'cat': 257,
|
||||||
|
'nal': 258,
|
||||||
|
' ri': 259,
|
||||||
|
'qua': 260,
|
||||||
|
't l': 261,
|
||||||
|
' do': 262,
|
||||||
|
't s': 263,
|
||||||
|
'rma': 264,
|
||||||
|
'ual': 265,
|
||||||
|
'i s': 266,
|
||||||
|
's f': 267,
|
||||||
|
'n p': 268,
|
||||||
|
's v': 269,
|
||||||
|
'te ': 270,
|
||||||
|
't i': 271,
|
||||||
|
' ba': 272,
|
||||||
|
'cte': 273,
|
||||||
|
'tam': 274,
|
||||||
|
'man': 275,
|
||||||
|
'l t': 276,
|
||||||
|
'ial': 277,
|
||||||
|
' fa': 278,
|
||||||
|
'ic ': 279,
|
||||||
|
' ve': 280,
|
||||||
|
'ble': 281,
|
||||||
|
'a n': 282,
|
||||||
|
'all': 283,
|
||||||
|
'tza': 284,
|
||||||
|
'ies': 285,
|
||||||
|
" s'": 286,
|
||||||
|
'le ': 287,
|
||||||
|
'omp': 288,
|
||||||
|
'r c': 289,
|
||||||
|
' nc': 290,
|
||||||
|
'rti': 291,
|
||||||
|
'it ': 292,
|
||||||
|
'rre': 293,
|
||||||
|
'fic': 294,
|
||||||
|
'any': 295,
|
||||||
|
'on ': 296,
|
||||||
|
' sa': 297,
|
||||||
|
'r p': 298,
|
||||||
|
'tur': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/ceb.py
Normal file
303
libs/guess_language/data/models/ceb.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'ng ': 0,
|
||||||
|
'sa ': 1,
|
||||||
|
' sa': 2,
|
||||||
|
'ang': 3,
|
||||||
|
'ga ': 4,
|
||||||
|
'nga': 5,
|
||||||
|
' ka': 6,
|
||||||
|
' ng': 7,
|
||||||
|
'an ': 8,
|
||||||
|
' an': 9,
|
||||||
|
' na': 10,
|
||||||
|
' ma': 11,
|
||||||
|
' ni': 12,
|
||||||
|
'a s': 13,
|
||||||
|
'a n': 14,
|
||||||
|
'on ': 15,
|
||||||
|
' pa': 16,
|
||||||
|
' si': 17,
|
||||||
|
'a k': 18,
|
||||||
|
'a m': 19,
|
||||||
|
' ba': 20,
|
||||||
|
'ong': 21,
|
||||||
|
'a i': 22,
|
||||||
|
'ila': 23,
|
||||||
|
' mg': 24,
|
||||||
|
'mga': 25,
|
||||||
|
'a p': 26,
|
||||||
|
'iya': 27,
|
||||||
|
'a a': 28,
|
||||||
|
'ay ': 29,
|
||||||
|
'ka ': 30,
|
||||||
|
'ala': 31,
|
||||||
|
'ing': 32,
|
||||||
|
'g m': 33,
|
||||||
|
'n s': 34,
|
||||||
|
'g n': 35,
|
||||||
|
'lan': 36,
|
||||||
|
' gi': 37,
|
||||||
|
'na ': 38,
|
||||||
|
'ni ': 39,
|
||||||
|
'o s': 40,
|
||||||
|
'g p': 41,
|
||||||
|
'n n': 42,
|
||||||
|
' da': 43,
|
||||||
|
'ag ': 44,
|
||||||
|
'pag': 45,
|
||||||
|
'g s': 46,
|
||||||
|
'yan': 47,
|
||||||
|
'ayo': 48,
|
||||||
|
'o n': 49,
|
||||||
|
'si ': 50,
|
||||||
|
' mo': 51,
|
||||||
|
'a b': 52,
|
||||||
|
'g a': 53,
|
||||||
|
'ail': 54,
|
||||||
|
'g b': 55,
|
||||||
|
'han': 56,
|
||||||
|
'a d': 57,
|
||||||
|
'asu': 58,
|
||||||
|
'nag': 59,
|
||||||
|
'ya ': 60,
|
||||||
|
'man': 61,
|
||||||
|
'ne ': 62,
|
||||||
|
'pan': 63,
|
||||||
|
'kon': 64,
|
||||||
|
' il': 65,
|
||||||
|
' la': 66,
|
||||||
|
'aka': 67,
|
||||||
|
'ako': 68,
|
||||||
|
'ana': 69,
|
||||||
|
'bas': 70,
|
||||||
|
'ko ': 71,
|
||||||
|
'od ': 72,
|
||||||
|
'yo ': 73,
|
||||||
|
' di': 74,
|
||||||
|
' ko': 75,
|
||||||
|
' ug': 76,
|
||||||
|
'a u': 77,
|
||||||
|
'g k': 78,
|
||||||
|
'kan': 79,
|
||||||
|
'la ': 80,
|
||||||
|
'len': 81,
|
||||||
|
'sur': 82,
|
||||||
|
'ug ': 83,
|
||||||
|
' ai': 84,
|
||||||
|
'apa': 85,
|
||||||
|
'aw ': 86,
|
||||||
|
'd s': 87,
|
||||||
|
'g d': 88,
|
||||||
|
'g g': 89,
|
||||||
|
'ile': 90,
|
||||||
|
'nin': 91,
|
||||||
|
' iy': 92,
|
||||||
|
' su': 93,
|
||||||
|
'ene': 94,
|
||||||
|
'og ': 95,
|
||||||
|
'ot ': 96,
|
||||||
|
'aba': 97,
|
||||||
|
'aha': 98,
|
||||||
|
'as ': 99,
|
||||||
|
'imo': 100,
|
||||||
|
' ki': 101,
|
||||||
|
'a t': 102,
|
||||||
|
'aga': 103,
|
||||||
|
'ban': 104,
|
||||||
|
'ero': 105,
|
||||||
|
'nan': 106,
|
||||||
|
'o k': 107,
|
||||||
|
'ran': 108,
|
||||||
|
'ron': 109,
|
||||||
|
'sil': 110,
|
||||||
|
'una': 111,
|
||||||
|
'usa': 112,
|
||||||
|
' us': 113,
|
||||||
|
'a g': 114,
|
||||||
|
'ahi': 115,
|
||||||
|
'ani': 116,
|
||||||
|
'er ': 117,
|
||||||
|
'ha ': 118,
|
||||||
|
'i a': 119,
|
||||||
|
'rer': 120,
|
||||||
|
'yon': 121,
|
||||||
|
' pu': 122,
|
||||||
|
'ini': 123,
|
||||||
|
'nak': 124,
|
||||||
|
'ro ': 125,
|
||||||
|
'to ': 126,
|
||||||
|
'ure': 127,
|
||||||
|
' ed': 128,
|
||||||
|
' og': 129,
|
||||||
|
' wa': 130,
|
||||||
|
'ili': 131,
|
||||||
|
'mo ': 132,
|
||||||
|
'n a': 133,
|
||||||
|
'nd ': 134,
|
||||||
|
'o a': 135,
|
||||||
|
' ad': 136,
|
||||||
|
' du': 137,
|
||||||
|
' pr': 138,
|
||||||
|
'aro': 139,
|
||||||
|
'i s': 140,
|
||||||
|
'ma ': 141,
|
||||||
|
'n m': 142,
|
||||||
|
'ulo': 143,
|
||||||
|
'und': 144,
|
||||||
|
' ta': 145,
|
||||||
|
'ara': 146,
|
||||||
|
'asa': 147,
|
||||||
|
'ato': 148,
|
||||||
|
'awa': 149,
|
||||||
|
'dmu': 150,
|
||||||
|
'e n': 151,
|
||||||
|
'edm': 152,
|
||||||
|
'ina': 153,
|
||||||
|
'mak': 154,
|
||||||
|
'mun': 155,
|
||||||
|
'niy': 156,
|
||||||
|
'san': 157,
|
||||||
|
'wa ': 158,
|
||||||
|
' tu': 159,
|
||||||
|
' un': 160,
|
||||||
|
'a l': 161,
|
||||||
|
'bay': 162,
|
||||||
|
'iga': 163,
|
||||||
|
'ika': 164,
|
||||||
|
'ita': 165,
|
||||||
|
'kin': 166,
|
||||||
|
'lis': 167,
|
||||||
|
'may': 168,
|
||||||
|
'os ': 169,
|
||||||
|
' ar': 170,
|
||||||
|
'ad ': 171,
|
||||||
|
'ali': 172,
|
||||||
|
'ama': 173,
|
||||||
|
'ers': 174,
|
||||||
|
'ipa': 175,
|
||||||
|
'isa': 176,
|
||||||
|
'mao': 177,
|
||||||
|
'nim': 178,
|
||||||
|
't s': 179,
|
||||||
|
'tin': 180,
|
||||||
|
' ak': 181,
|
||||||
|
' ap': 182,
|
||||||
|
' hi': 183,
|
||||||
|
'abo': 184,
|
||||||
|
'agp': 185,
|
||||||
|
'ano': 186,
|
||||||
|
'ata': 187,
|
||||||
|
'g i': 188,
|
||||||
|
'gan': 189,
|
||||||
|
'gka': 190,
|
||||||
|
'gpa': 191,
|
||||||
|
'i m': 192,
|
||||||
|
'iha': 193,
|
||||||
|
'k s': 194,
|
||||||
|
'law': 195,
|
||||||
|
'or ': 196,
|
||||||
|
'rs ': 197,
|
||||||
|
'siy': 198,
|
||||||
|
'tag': 199,
|
||||||
|
' al': 200,
|
||||||
|
' at': 201,
|
||||||
|
' ha': 202,
|
||||||
|
' hu': 203,
|
||||||
|
' im': 204,
|
||||||
|
'a h': 205,
|
||||||
|
'bu ': 206,
|
||||||
|
'e s': 207,
|
||||||
|
'gma': 208,
|
||||||
|
'kas': 209,
|
||||||
|
'lag': 210,
|
||||||
|
'mon': 211,
|
||||||
|
'nah': 212,
|
||||||
|
'ngo': 213,
|
||||||
|
'r s': 214,
|
||||||
|
'ra ': 215,
|
||||||
|
'sab': 216,
|
||||||
|
'sam': 217,
|
||||||
|
'sul': 218,
|
||||||
|
'uba': 219,
|
||||||
|
'uha': 220,
|
||||||
|
' lo': 221,
|
||||||
|
' re': 222,
|
||||||
|
'ada': 223,
|
||||||
|
'aki': 224,
|
||||||
|
'aya': 225,
|
||||||
|
'bah': 226,
|
||||||
|
'ce ': 227,
|
||||||
|
'd n': 228,
|
||||||
|
'lab': 229,
|
||||||
|
'pa ': 230,
|
||||||
|
'pak': 231,
|
||||||
|
's n': 232,
|
||||||
|
's s': 233,
|
||||||
|
'tan': 234,
|
||||||
|
'taw': 235,
|
||||||
|
'te ': 236,
|
||||||
|
'uma': 237,
|
||||||
|
'ura': 238,
|
||||||
|
' in': 239,
|
||||||
|
' lu': 240,
|
||||||
|
'a c': 241,
|
||||||
|
'abi': 242,
|
||||||
|
'at ': 243,
|
||||||
|
'awo': 244,
|
||||||
|
'bat': 245,
|
||||||
|
'dal': 246,
|
||||||
|
'dla': 247,
|
||||||
|
'ele': 248,
|
||||||
|
'g t': 249,
|
||||||
|
'g u': 250,
|
||||||
|
'gay': 251,
|
||||||
|
'go ': 252,
|
||||||
|
'hab': 253,
|
||||||
|
'hin': 254,
|
||||||
|
'i e': 255,
|
||||||
|
'i n': 256,
|
||||||
|
'kab': 257,
|
||||||
|
'kap': 258,
|
||||||
|
'lay': 259,
|
||||||
|
'lin': 260,
|
||||||
|
'nil': 261,
|
||||||
|
'pam': 262,
|
||||||
|
'pas': 263,
|
||||||
|
'pro': 264,
|
||||||
|
'pul': 265,
|
||||||
|
'ta ': 266,
|
||||||
|
'ton': 267,
|
||||||
|
'uga': 268,
|
||||||
|
'ugm': 269,
|
||||||
|
'unt': 270,
|
||||||
|
' co': 271,
|
||||||
|
' gu': 272,
|
||||||
|
' mi': 273,
|
||||||
|
' pi': 274,
|
||||||
|
' ti': 275,
|
||||||
|
'a o': 276,
|
||||||
|
'abu': 277,
|
||||||
|
'adl': 278,
|
||||||
|
'ado': 279,
|
||||||
|
'agh': 280,
|
||||||
|
'agk': 281,
|
||||||
|
'ao ': 282,
|
||||||
|
'art': 283,
|
||||||
|
'bal': 284,
|
||||||
|
'cit': 285,
|
||||||
|
'di ': 286,
|
||||||
|
'dto': 287,
|
||||||
|
'dun': 288,
|
||||||
|
'ent': 289,
|
||||||
|
'g e': 290,
|
||||||
|
'gon': 291,
|
||||||
|
'gug': 292,
|
||||||
|
'ia ': 293,
|
||||||
|
'iba': 294,
|
||||||
|
'ice': 295,
|
||||||
|
'in ': 296,
|
||||||
|
'inu': 297,
|
||||||
|
'it ': 298,
|
||||||
|
'kaa': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/cs.py
Normal file
303
libs/guess_language/data/models/cs.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
' pr': 0,
|
||||||
|
' po': 1,
|
||||||
|
'ní ': 2,
|
||||||
|
'pro': 3,
|
||||||
|
' na': 4,
|
||||||
|
'na ': 5,
|
||||||
|
' př': 6,
|
||||||
|
'ch ': 7,
|
||||||
|
' je': 8,
|
||||||
|
' ne': 9,
|
||||||
|
'že ': 10,
|
||||||
|
' že': 11,
|
||||||
|
' se': 12,
|
||||||
|
' do': 13,
|
||||||
|
' ro': 14,
|
||||||
|
' st': 15,
|
||||||
|
' v ': 16,
|
||||||
|
' ve': 17,
|
||||||
|
'pře': 18,
|
||||||
|
'se ': 19,
|
||||||
|
'ho ': 20,
|
||||||
|
'sta': 21,
|
||||||
|
' to': 22,
|
||||||
|
' vy': 23,
|
||||||
|
' za': 24,
|
||||||
|
'ou ': 25,
|
||||||
|
' a ': 26,
|
||||||
|
'to ': 27,
|
||||||
|
' by': 28,
|
||||||
|
'la ': 29,
|
||||||
|
'ce ': 30,
|
||||||
|
'e v': 31,
|
||||||
|
'ist': 32,
|
||||||
|
'le ': 33,
|
||||||
|
'pod': 34,
|
||||||
|
'í p': 35,
|
||||||
|
' vl': 36,
|
||||||
|
'e n': 37,
|
||||||
|
'e s': 38,
|
||||||
|
'je ': 39,
|
||||||
|
'ké ': 40,
|
||||||
|
'by ': 41,
|
||||||
|
'em ': 42,
|
||||||
|
'ých': 43,
|
||||||
|
' od': 44,
|
||||||
|
'ova': 45,
|
||||||
|
'řed': 46,
|
||||||
|
'dy ': 47,
|
||||||
|
'ení': 48,
|
||||||
|
'kon': 49,
|
||||||
|
'li ': 50,
|
||||||
|
'ně ': 51,
|
||||||
|
'str': 52,
|
||||||
|
' zá': 53,
|
||||||
|
've ': 54,
|
||||||
|
' ka': 55,
|
||||||
|
' sv': 56,
|
||||||
|
'e p': 57,
|
||||||
|
'it ': 58,
|
||||||
|
'lád': 59,
|
||||||
|
'oho': 60,
|
||||||
|
'rov': 61,
|
||||||
|
'roz': 62,
|
||||||
|
'ter': 63,
|
||||||
|
'vlá': 64,
|
||||||
|
'ím ': 65,
|
||||||
|
' ko': 66,
|
||||||
|
'hod': 67,
|
||||||
|
'nis': 68,
|
||||||
|
'pří': 69,
|
||||||
|
'ský': 70,
|
||||||
|
' mi': 71,
|
||||||
|
' ob': 72,
|
||||||
|
' so': 73,
|
||||||
|
'a p': 74,
|
||||||
|
'ali': 75,
|
||||||
|
'bud': 76,
|
||||||
|
'edn': 77,
|
||||||
|
'ick': 78,
|
||||||
|
'kte': 79,
|
||||||
|
'ku ': 80,
|
||||||
|
'o s': 81,
|
||||||
|
'al ': 82,
|
||||||
|
'ci ': 83,
|
||||||
|
'e t': 84,
|
||||||
|
'il ': 85,
|
||||||
|
'ny ': 86,
|
||||||
|
'né ': 87,
|
||||||
|
'odl': 88,
|
||||||
|
'ová': 89,
|
||||||
|
'rot': 90,
|
||||||
|
'sou': 91,
|
||||||
|
'ání': 92,
|
||||||
|
' bu': 93,
|
||||||
|
' mo': 94,
|
||||||
|
' o ': 95,
|
||||||
|
'ast': 96,
|
||||||
|
'byl': 97,
|
||||||
|
'de ': 98,
|
||||||
|
'ek ': 99,
|
||||||
|
'ost': 100,
|
||||||
|
' mí': 101,
|
||||||
|
' ta': 102,
|
||||||
|
'es ': 103,
|
||||||
|
'jed': 104,
|
||||||
|
'ky ': 105,
|
||||||
|
'las': 106,
|
||||||
|
'm p': 107,
|
||||||
|
'nes': 108,
|
||||||
|
'ním': 109,
|
||||||
|
'ran': 110,
|
||||||
|
'rem': 111,
|
||||||
|
'ros': 112,
|
||||||
|
'ého': 113,
|
||||||
|
' de': 114,
|
||||||
|
' kt': 115,
|
||||||
|
' ni': 116,
|
||||||
|
' si': 117,
|
||||||
|
' vý': 118,
|
||||||
|
'at ': 119,
|
||||||
|
'jí ': 120,
|
||||||
|
'ký ': 121,
|
||||||
|
'mi ': 122,
|
||||||
|
'pre': 123,
|
||||||
|
'tak': 124,
|
||||||
|
'tan': 125,
|
||||||
|
'y v': 126,
|
||||||
|
'řek': 127,
|
||||||
|
' ch': 128,
|
||||||
|
' li': 129,
|
||||||
|
' ná': 130,
|
||||||
|
' pa': 131,
|
||||||
|
' ře': 132,
|
||||||
|
'da ': 133,
|
||||||
|
'dle': 134,
|
||||||
|
'dne': 135,
|
||||||
|
'i p': 136,
|
||||||
|
'i v': 137,
|
||||||
|
'ly ': 138,
|
||||||
|
'min': 139,
|
||||||
|
'o n': 140,
|
||||||
|
'o v': 141,
|
||||||
|
'pol': 142,
|
||||||
|
'tra': 143,
|
||||||
|
'val': 144,
|
||||||
|
'vní': 145,
|
||||||
|
'ích': 146,
|
||||||
|
'ý p': 147,
|
||||||
|
'řej': 148,
|
||||||
|
' ce': 149,
|
||||||
|
' kd': 150,
|
||||||
|
' le': 151,
|
||||||
|
'a s': 152,
|
||||||
|
'a z': 153,
|
||||||
|
'cen': 154,
|
||||||
|
'e k': 155,
|
||||||
|
'eds': 156,
|
||||||
|
'ekl': 157,
|
||||||
|
'emi': 158,
|
||||||
|
'kl ': 159,
|
||||||
|
'lat': 160,
|
||||||
|
'lo ': 161,
|
||||||
|
'mié': 162,
|
||||||
|
'nov': 163,
|
||||||
|
'pra': 164,
|
||||||
|
'sku': 165,
|
||||||
|
'ské': 166,
|
||||||
|
'sti': 167,
|
||||||
|
'tav': 168,
|
||||||
|
'ti ': 169,
|
||||||
|
'ty ': 170,
|
||||||
|
'ván': 171,
|
||||||
|
'vé ': 172,
|
||||||
|
'y n': 173,
|
||||||
|
'y s': 174,
|
||||||
|
'í s': 175,
|
||||||
|
'í v': 176,
|
||||||
|
'ě p': 177,
|
||||||
|
' dn': 178,
|
||||||
|
' ně': 179,
|
||||||
|
' sp': 180,
|
||||||
|
' čs': 181,
|
||||||
|
'a n': 182,
|
||||||
|
'a t': 183,
|
||||||
|
'ak ': 184,
|
||||||
|
'dní': 185,
|
||||||
|
'doh': 186,
|
||||||
|
'e b': 187,
|
||||||
|
'e m': 188,
|
||||||
|
'ejn': 189,
|
||||||
|
'ena': 190,
|
||||||
|
'est': 191,
|
||||||
|
'ini': 192,
|
||||||
|
'm z': 193,
|
||||||
|
'nal': 194,
|
||||||
|
'nou': 195,
|
||||||
|
'ná ': 196,
|
||||||
|
'ovi': 197,
|
||||||
|
'ové': 198,
|
||||||
|
'ový': 199,
|
||||||
|
'rsk': 200,
|
||||||
|
'stá': 201,
|
||||||
|
'tí ': 202,
|
||||||
|
'tře': 203,
|
||||||
|
'tů ': 204,
|
||||||
|
'ude': 205,
|
||||||
|
'za ': 206,
|
||||||
|
'é p': 207,
|
||||||
|
'ém ': 208,
|
||||||
|
'í d': 209,
|
||||||
|
' ir': 210,
|
||||||
|
' zv': 211,
|
||||||
|
'ale': 212,
|
||||||
|
'aně': 213,
|
||||||
|
'ave': 214,
|
||||||
|
'cké': 215,
|
||||||
|
'den': 216,
|
||||||
|
'e z': 217,
|
||||||
|
'ech': 218,
|
||||||
|
'en ': 219,
|
||||||
|
'erý': 220,
|
||||||
|
'hla': 221,
|
||||||
|
'i s': 222,
|
||||||
|
'iér': 223,
|
||||||
|
'lov': 224,
|
||||||
|
'mu ': 225,
|
||||||
|
'neb': 226,
|
||||||
|
'nic': 227,
|
||||||
|
'o b': 228,
|
||||||
|
'o m': 229,
|
||||||
|
'pad': 230,
|
||||||
|
'pot': 231,
|
||||||
|
'rav': 232,
|
||||||
|
'rop': 233,
|
||||||
|
'rý ': 234,
|
||||||
|
'sed': 235,
|
||||||
|
'si ': 236,
|
||||||
|
't p': 237,
|
||||||
|
'tic': 238,
|
||||||
|
'tu ': 239,
|
||||||
|
'tě ': 240,
|
||||||
|
'u p': 241,
|
||||||
|
'u v': 242,
|
||||||
|
'vá ': 243,
|
||||||
|
'výš': 244,
|
||||||
|
'zvý': 245,
|
||||||
|
'ční': 246,
|
||||||
|
'ří ': 247,
|
||||||
|
'ům ': 248,
|
||||||
|
' bl': 249,
|
||||||
|
' br': 250,
|
||||||
|
' ho': 251,
|
||||||
|
' ja': 252,
|
||||||
|
' re': 253,
|
||||||
|
' s ': 254,
|
||||||
|
' z ': 255,
|
||||||
|
' zd': 256,
|
||||||
|
'a v': 257,
|
||||||
|
'ani': 258,
|
||||||
|
'ato': 259,
|
||||||
|
'bla': 260,
|
||||||
|
'bri': 261,
|
||||||
|
'ečn': 262,
|
||||||
|
'eře': 263,
|
||||||
|
'h v': 264,
|
||||||
|
'i n': 265,
|
||||||
|
'ie ': 266,
|
||||||
|
'ila': 267,
|
||||||
|
'irs': 268,
|
||||||
|
'ite': 269,
|
||||||
|
'kov': 270,
|
||||||
|
'nos': 271,
|
||||||
|
'o o': 272,
|
||||||
|
'o p': 273,
|
||||||
|
'oce': 274,
|
||||||
|
'ody': 275,
|
||||||
|
'ohl': 276,
|
||||||
|
'oli': 277,
|
||||||
|
'ovo': 278,
|
||||||
|
'pla': 279,
|
||||||
|
'poč': 280,
|
||||||
|
'prá': 281,
|
||||||
|
'ra ': 282,
|
||||||
|
'rit': 283,
|
||||||
|
'rod': 284,
|
||||||
|
'ry ': 285,
|
||||||
|
'sd ': 286,
|
||||||
|
'sko': 287,
|
||||||
|
'ssd': 288,
|
||||||
|
'tel': 289,
|
||||||
|
'u s': 290,
|
||||||
|
'vat': 291,
|
||||||
|
'veř': 292,
|
||||||
|
'vit': 293,
|
||||||
|
'vla': 294,
|
||||||
|
'y p': 295,
|
||||||
|
'áln': 296,
|
||||||
|
'čss': 297,
|
||||||
|
'šen': 298,
|
||||||
|
' al': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/cy.py
Normal file
303
libs/guess_language/data/models/cy.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'yn ': 0,
|
||||||
|
'dd ': 1,
|
||||||
|
' yn': 2,
|
||||||
|
' y ': 3,
|
||||||
|
'ydd': 4,
|
||||||
|
'eth': 5,
|
||||||
|
'th ': 6,
|
||||||
|
' i ': 7,
|
||||||
|
'aet': 8,
|
||||||
|
'd y': 9,
|
||||||
|
'ch ': 10,
|
||||||
|
'od ': 11,
|
||||||
|
'ol ': 12,
|
||||||
|
'edd': 13,
|
||||||
|
' ga': 14,
|
||||||
|
' gw': 15,
|
||||||
|
"'r ": 16,
|
||||||
|
'au ': 17,
|
||||||
|
'ddi': 18,
|
||||||
|
'ad ': 19,
|
||||||
|
' cy': 20,
|
||||||
|
' gy': 21,
|
||||||
|
' ei': 22,
|
||||||
|
' o ': 23,
|
||||||
|
'iad': 24,
|
||||||
|
'yr ': 25,
|
||||||
|
'an ': 26,
|
||||||
|
'bod': 27,
|
||||||
|
'wed': 28,
|
||||||
|
' bo': 29,
|
||||||
|
' dd': 30,
|
||||||
|
'el ': 31,
|
||||||
|
'n y': 32,
|
||||||
|
' am': 33,
|
||||||
|
'di ': 34,
|
||||||
|
'edi': 35,
|
||||||
|
'on ': 36,
|
||||||
|
' we': 37,
|
||||||
|
' ym': 38,
|
||||||
|
' ar': 39,
|
||||||
|
' rh': 40,
|
||||||
|
'odd': 41,
|
||||||
|
' ca': 42,
|
||||||
|
' ma': 43,
|
||||||
|
'ael': 44,
|
||||||
|
'oed': 45,
|
||||||
|
'dae': 46,
|
||||||
|
'n a': 47,
|
||||||
|
'dda': 48,
|
||||||
|
'er ': 49,
|
||||||
|
'h y': 50,
|
||||||
|
'all': 51,
|
||||||
|
'ei ': 52,
|
||||||
|
' ll': 53,
|
||||||
|
'am ': 54,
|
||||||
|
'eu ': 55,
|
||||||
|
'fod': 56,
|
||||||
|
'fyd': 57,
|
||||||
|
'l y': 58,
|
||||||
|
'n g': 59,
|
||||||
|
'wyn': 60,
|
||||||
|
'd a': 61,
|
||||||
|
'i g': 62,
|
||||||
|
'mae': 63,
|
||||||
|
'neu': 64,
|
||||||
|
'os ': 65,
|
||||||
|
' ne': 66,
|
||||||
|
'd i': 67,
|
||||||
|
'dod': 68,
|
||||||
|
'dol': 69,
|
||||||
|
'n c': 70,
|
||||||
|
'r h': 71,
|
||||||
|
'wyd': 72,
|
||||||
|
'wyr': 73,
|
||||||
|
'ai ': 74,
|
||||||
|
'ar ': 75,
|
||||||
|
'in ': 76,
|
||||||
|
'rth': 77,
|
||||||
|
' fy': 78,
|
||||||
|
' he': 79,
|
||||||
|
' me': 80,
|
||||||
|
' yr': 81,
|
||||||
|
"'n ": 82,
|
||||||
|
'dia': 83,
|
||||||
|
'est': 84,
|
||||||
|
'h c': 85,
|
||||||
|
'hai': 86,
|
||||||
|
'i d': 87,
|
||||||
|
'id ': 88,
|
||||||
|
'r y': 89,
|
||||||
|
'y b': 90,
|
||||||
|
' dy': 91,
|
||||||
|
' ha': 92,
|
||||||
|
'ada': 93,
|
||||||
|
'i b': 94,
|
||||||
|
'n i': 95,
|
||||||
|
'ote': 96,
|
||||||
|
'rot': 97,
|
||||||
|
'tes': 98,
|
||||||
|
'y g': 99,
|
||||||
|
'yd ': 100,
|
||||||
|
' ad': 101,
|
||||||
|
' mr': 102,
|
||||||
|
' un': 103,
|
||||||
|
'cyn': 104,
|
||||||
|
'dau': 105,
|
||||||
|
'ddy': 106,
|
||||||
|
'edo': 107,
|
||||||
|
'i c': 108,
|
||||||
|
'i w': 109,
|
||||||
|
'ith': 110,
|
||||||
|
'lae': 111,
|
||||||
|
'lla': 112,
|
||||||
|
'nd ': 113,
|
||||||
|
'oda': 114,
|
||||||
|
'ryd': 115,
|
||||||
|
'tho': 116,
|
||||||
|
' a ': 117,
|
||||||
|
' dr': 118,
|
||||||
|
'aid': 119,
|
||||||
|
'ain': 120,
|
||||||
|
'ddo': 121,
|
||||||
|
'dyd': 122,
|
||||||
|
'fyn': 123,
|
||||||
|
'gyn': 124,
|
||||||
|
'hol': 125,
|
||||||
|
'io ': 126,
|
||||||
|
'o a': 127,
|
||||||
|
'wch': 128,
|
||||||
|
'wyb': 129,
|
||||||
|
'ybo': 130,
|
||||||
|
'ych': 131,
|
||||||
|
' br': 132,
|
||||||
|
' by': 133,
|
||||||
|
' di': 134,
|
||||||
|
' fe': 135,
|
||||||
|
' na': 136,
|
||||||
|
" o'": 137,
|
||||||
|
' pe': 138,
|
||||||
|
'art': 139,
|
||||||
|
'byd': 140,
|
||||||
|
'dro': 141,
|
||||||
|
'gal': 142,
|
||||||
|
'l e': 143,
|
||||||
|
'lai': 144,
|
||||||
|
'mr ': 145,
|
||||||
|
'n n': 146,
|
||||||
|
'r a': 147,
|
||||||
|
'rhy': 148,
|
||||||
|
'wn ': 149,
|
||||||
|
'ynn': 150,
|
||||||
|
' on': 151,
|
||||||
|
' r ': 152,
|
||||||
|
'cae': 153,
|
||||||
|
'd g': 154,
|
||||||
|
'd o': 155,
|
||||||
|
'd w': 156,
|
||||||
|
'gan': 157,
|
||||||
|
'gwy': 158,
|
||||||
|
'n d': 159,
|
||||||
|
'n f': 160,
|
||||||
|
'n o': 161,
|
||||||
|
'ned': 162,
|
||||||
|
'ni ': 163,
|
||||||
|
"o'r": 164,
|
||||||
|
'r d': 165,
|
||||||
|
'ud ': 166,
|
||||||
|
'wei': 167,
|
||||||
|
'wrt': 168,
|
||||||
|
' an': 169,
|
||||||
|
' cw': 170,
|
||||||
|
' da': 171,
|
||||||
|
' ni': 172,
|
||||||
|
' pa': 173,
|
||||||
|
' pr': 174,
|
||||||
|
' wy': 175,
|
||||||
|
'd e': 176,
|
||||||
|
'dai': 177,
|
||||||
|
'dim': 178,
|
||||||
|
'eud': 179,
|
||||||
|
'gwa': 180,
|
||||||
|
'idd': 181,
|
||||||
|
'im ': 182,
|
||||||
|
'iri': 183,
|
||||||
|
'lwy': 184,
|
||||||
|
'n b': 185,
|
||||||
|
'nol': 186,
|
||||||
|
'r o': 187,
|
||||||
|
'rwy': 188,
|
||||||
|
' ch': 189,
|
||||||
|
' er': 190,
|
||||||
|
' fo': 191,
|
||||||
|
' ge': 192,
|
||||||
|
' hy': 193,
|
||||||
|
" i'": 194,
|
||||||
|
' ro': 195,
|
||||||
|
' sa': 196,
|
||||||
|
' tr': 197,
|
||||||
|
'bob': 198,
|
||||||
|
'cwy': 199,
|
||||||
|
'cyf': 200,
|
||||||
|
'dio': 201,
|
||||||
|
'dyn': 202,
|
||||||
|
'eit': 203,
|
||||||
|
'hel': 204,
|
||||||
|
'hyn': 205,
|
||||||
|
'ich': 206,
|
||||||
|
'll ': 207,
|
||||||
|
'mdd': 208,
|
||||||
|
'n r': 209,
|
||||||
|
'ond': 210,
|
||||||
|
'pro': 211,
|
||||||
|
'r c': 212,
|
||||||
|
'r g': 213,
|
||||||
|
'red': 214,
|
||||||
|
'rha': 215,
|
||||||
|
'u a': 216,
|
||||||
|
'u c': 217,
|
||||||
|
'u y': 218,
|
||||||
|
'y c': 219,
|
||||||
|
'ymd': 220,
|
||||||
|
'ymr': 221,
|
||||||
|
'yw ': 222,
|
||||||
|
' ac': 223,
|
||||||
|
' be': 224,
|
||||||
|
' bl': 225,
|
||||||
|
' co': 226,
|
||||||
|
' os': 227,
|
||||||
|
'adw': 228,
|
||||||
|
'ae ': 229,
|
||||||
|
'af ': 230,
|
||||||
|
'd p': 231,
|
||||||
|
'efn': 232,
|
||||||
|
'eic': 233,
|
||||||
|
'en ': 234,
|
||||||
|
'eol': 235,
|
||||||
|
'es ': 236,
|
||||||
|
'fer': 237,
|
||||||
|
'gel': 238,
|
||||||
|
'h g': 239,
|
||||||
|
'hod': 240,
|
||||||
|
'ied': 241,
|
||||||
|
'ir ': 242,
|
||||||
|
'laf': 243,
|
||||||
|
'n h': 244,
|
||||||
|
'na ': 245,
|
||||||
|
'nyd': 246,
|
||||||
|
'odo': 247,
|
||||||
|
'ofy': 248,
|
||||||
|
'rdd': 249,
|
||||||
|
'rie': 250,
|
||||||
|
'ros': 251,
|
||||||
|
'stw': 252,
|
||||||
|
'twy': 253,
|
||||||
|
'yda': 254,
|
||||||
|
'yng': 255,
|
||||||
|
' at': 256,
|
||||||
|
' de': 257,
|
||||||
|
' go': 258,
|
||||||
|
' id': 259,
|
||||||
|
' oe': 260,
|
||||||
|
' â ': 261,
|
||||||
|
"'ch": 262,
|
||||||
|
'ac ': 263,
|
||||||
|
'ach': 264,
|
||||||
|
"ae'": 265,
|
||||||
|
'al ': 266,
|
||||||
|
'bl ': 267,
|
||||||
|
'd c': 268,
|
||||||
|
'd l': 269,
|
||||||
|
'dan': 270,
|
||||||
|
'dde': 271,
|
||||||
|
'ddw': 272,
|
||||||
|
'dir': 273,
|
||||||
|
'dla': 274,
|
||||||
|
'ed ': 275,
|
||||||
|
'ela': 276,
|
||||||
|
'ell': 277,
|
||||||
|
'ene': 278,
|
||||||
|
'ewn': 279,
|
||||||
|
'gyd': 280,
|
||||||
|
'hau': 281,
|
||||||
|
'hyw': 282,
|
||||||
|
'i a': 283,
|
||||||
|
'i f': 284,
|
||||||
|
'iol': 285,
|
||||||
|
'ion': 286,
|
||||||
|
'l a': 287,
|
||||||
|
'l i': 288,
|
||||||
|
'lia': 289,
|
||||||
|
'med': 290,
|
||||||
|
'mon': 291,
|
||||||
|
'n s': 292,
|
||||||
|
'no ': 293,
|
||||||
|
'obl': 294,
|
||||||
|
'ola': 295,
|
||||||
|
'ref': 296,
|
||||||
|
'rn ': 297,
|
||||||
|
'thi': 298,
|
||||||
|
'un ': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/da.py
Normal file
303
libs/guess_language/data/models/da.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'er ': 0,
|
||||||
|
'en ': 1,
|
||||||
|
' de': 2,
|
||||||
|
'et ': 3,
|
||||||
|
'der': 4,
|
||||||
|
'de ': 5,
|
||||||
|
'for': 6,
|
||||||
|
' fo': 7,
|
||||||
|
' i ': 8,
|
||||||
|
'at ': 9,
|
||||||
|
' at': 10,
|
||||||
|
're ': 11,
|
||||||
|
'det': 12,
|
||||||
|
' ha': 13,
|
||||||
|
'nde': 14,
|
||||||
|
'ere': 15,
|
||||||
|
'ing': 16,
|
||||||
|
'den': 17,
|
||||||
|
' me': 18,
|
||||||
|
' og': 19,
|
||||||
|
'ger': 20,
|
||||||
|
'ter': 21,
|
||||||
|
' er': 22,
|
||||||
|
' si': 23,
|
||||||
|
'and': 24,
|
||||||
|
' af': 25,
|
||||||
|
'or ': 26,
|
||||||
|
' st': 27,
|
||||||
|
' ti': 28,
|
||||||
|
' en': 29,
|
||||||
|
'og ': 30,
|
||||||
|
'ar ': 31,
|
||||||
|
'il ': 32,
|
||||||
|
'r s': 33,
|
||||||
|
'ige': 34,
|
||||||
|
'til': 35,
|
||||||
|
'ke ': 36,
|
||||||
|
'r e': 37,
|
||||||
|
'af ': 38,
|
||||||
|
'kke': 39,
|
||||||
|
' ma': 40,
|
||||||
|
' på': 41,
|
||||||
|
'om ': 42,
|
||||||
|
'på ': 43,
|
||||||
|
'ed ': 44,
|
||||||
|
'ge ': 45,
|
||||||
|
'end': 46,
|
||||||
|
'nge': 47,
|
||||||
|
't s': 48,
|
||||||
|
'e s': 49,
|
||||||
|
'ler': 50,
|
||||||
|
' sk': 51,
|
||||||
|
'els': 52,
|
||||||
|
'ern': 53,
|
||||||
|
'sig': 54,
|
||||||
|
'ne ': 55,
|
||||||
|
'lig': 56,
|
||||||
|
'r d': 57,
|
||||||
|
'ska': 58,
|
||||||
|
' vi': 59,
|
||||||
|
'har': 60,
|
||||||
|
' be': 61,
|
||||||
|
' se': 62,
|
||||||
|
'an ': 63,
|
||||||
|
'ikk': 64,
|
||||||
|
'lle': 65,
|
||||||
|
'gen': 66,
|
||||||
|
'n f': 67,
|
||||||
|
'ste': 68,
|
||||||
|
't a': 69,
|
||||||
|
't d': 70,
|
||||||
|
'rin': 71,
|
||||||
|
' ik': 72,
|
||||||
|
'es ': 73,
|
||||||
|
'ng ': 74,
|
||||||
|
'ver': 75,
|
||||||
|
'r b': 76,
|
||||||
|
'sen': 77,
|
||||||
|
'ede': 78,
|
||||||
|
'men': 79,
|
||||||
|
'r i': 80,
|
||||||
|
' he': 81,
|
||||||
|
' et': 82,
|
||||||
|
'ig ': 83,
|
||||||
|
'lan': 84,
|
||||||
|
'med': 85,
|
||||||
|
'nd ': 86,
|
||||||
|
'rne': 87,
|
||||||
|
' da': 88,
|
||||||
|
' in': 89,
|
||||||
|
'e t': 90,
|
||||||
|
'mme': 91,
|
||||||
|
'und': 92,
|
||||||
|
' om': 93,
|
||||||
|
'e e': 94,
|
||||||
|
'e m': 95,
|
||||||
|
'her': 96,
|
||||||
|
'le ': 97,
|
||||||
|
'r f': 98,
|
||||||
|
't f': 99,
|
||||||
|
'så ': 100,
|
||||||
|
'te ': 101,
|
||||||
|
' so': 102,
|
||||||
|
'ele': 103,
|
||||||
|
't e': 104,
|
||||||
|
' ko': 105,
|
||||||
|
'est': 106,
|
||||||
|
'ske': 107,
|
||||||
|
' bl': 108,
|
||||||
|
'e f': 109,
|
||||||
|
'ekt': 110,
|
||||||
|
'mar': 111,
|
||||||
|
'bru': 112,
|
||||||
|
'e a': 113,
|
||||||
|
'el ': 114,
|
||||||
|
'ers': 115,
|
||||||
|
'ret': 116,
|
||||||
|
'som': 117,
|
||||||
|
'tte': 118,
|
||||||
|
've ': 119,
|
||||||
|
' la': 120,
|
||||||
|
' ud': 121,
|
||||||
|
' ve': 122,
|
||||||
|
'age': 123,
|
||||||
|
'e d': 124,
|
||||||
|
'e h': 125,
|
||||||
|
'lse': 126,
|
||||||
|
'man': 127,
|
||||||
|
'rug': 128,
|
||||||
|
'sel': 129,
|
||||||
|
'ser': 130,
|
||||||
|
' fi': 131,
|
||||||
|
' op': 132,
|
||||||
|
' pr': 133,
|
||||||
|
'dt ': 134,
|
||||||
|
'e i': 135,
|
||||||
|
'n m': 136,
|
||||||
|
'r m': 137,
|
||||||
|
' an': 138,
|
||||||
|
' re': 139,
|
||||||
|
' sa': 140,
|
||||||
|
'ion': 141,
|
||||||
|
'ner': 142,
|
||||||
|
'res': 143,
|
||||||
|
't i': 144,
|
||||||
|
'get': 145,
|
||||||
|
'n s': 146,
|
||||||
|
'one': 147,
|
||||||
|
'orb': 148,
|
||||||
|
't h': 149,
|
||||||
|
'vis': 150,
|
||||||
|
'år ': 151,
|
||||||
|
' fr': 152,
|
||||||
|
'bil': 153,
|
||||||
|
'e k': 154,
|
||||||
|
'ens': 155,
|
||||||
|
'ind': 156,
|
||||||
|
'omm': 157,
|
||||||
|
't m': 158,
|
||||||
|
' hv': 159,
|
||||||
|
' je': 160,
|
||||||
|
'dan': 161,
|
||||||
|
'ent': 162,
|
||||||
|
'fte': 163,
|
||||||
|
'nin': 164,
|
||||||
|
' mi': 165,
|
||||||
|
'e o': 166,
|
||||||
|
'e p': 167,
|
||||||
|
'n o': 168,
|
||||||
|
'nte': 169,
|
||||||
|
' ku': 170,
|
||||||
|
'ell': 171,
|
||||||
|
'nas': 172,
|
||||||
|
'ore': 173,
|
||||||
|
'r h': 174,
|
||||||
|
'r k': 175,
|
||||||
|
'sta': 176,
|
||||||
|
'sto': 177,
|
||||||
|
'dag': 178,
|
||||||
|
'eri': 179,
|
||||||
|
'kun': 180,
|
||||||
|
'lde': 181,
|
||||||
|
'mer': 182,
|
||||||
|
'r a': 183,
|
||||||
|
'r v': 184,
|
||||||
|
'rek': 185,
|
||||||
|
'rer': 186,
|
||||||
|
't o': 187,
|
||||||
|
'tor': 188,
|
||||||
|
'tør': 189,
|
||||||
|
' få': 190,
|
||||||
|
' må': 191,
|
||||||
|
' to': 192,
|
||||||
|
'boe': 193,
|
||||||
|
'che': 194,
|
||||||
|
'e v': 195,
|
||||||
|
'i d': 196,
|
||||||
|
'ive': 197,
|
||||||
|
'kab': 198,
|
||||||
|
'ns ': 199,
|
||||||
|
'oel': 200,
|
||||||
|
'se ': 201,
|
||||||
|
't v': 202,
|
||||||
|
' al': 203,
|
||||||
|
' bo': 204,
|
||||||
|
' un': 205,
|
||||||
|
'ans': 206,
|
||||||
|
'dre': 207,
|
||||||
|
'ire': 208,
|
||||||
|
'køb': 209,
|
||||||
|
'ors': 210,
|
||||||
|
'ove': 211,
|
||||||
|
'ren': 212,
|
||||||
|
't b': 213,
|
||||||
|
'ør ': 214,
|
||||||
|
' ka': 215,
|
||||||
|
'ald': 216,
|
||||||
|
'bet': 217,
|
||||||
|
'gt ': 218,
|
||||||
|
'isk': 219,
|
||||||
|
'kal': 220,
|
||||||
|
'kom': 221,
|
||||||
|
'lev': 222,
|
||||||
|
'n d': 223,
|
||||||
|
'n i': 224,
|
||||||
|
'pri': 225,
|
||||||
|
'r p': 226,
|
||||||
|
'rbr': 227,
|
||||||
|
'søg': 228,
|
||||||
|
'tel': 229,
|
||||||
|
' så': 230,
|
||||||
|
' te': 231,
|
||||||
|
' va': 232,
|
||||||
|
'al ': 233,
|
||||||
|
'dir': 234,
|
||||||
|
'eje': 235,
|
||||||
|
'fis': 236,
|
||||||
|
'gså': 237,
|
||||||
|
'isc': 238,
|
||||||
|
'jer': 239,
|
||||||
|
'ker': 240,
|
||||||
|
'ogs': 241,
|
||||||
|
'sch': 242,
|
||||||
|
'st ': 243,
|
||||||
|
't k': 244,
|
||||||
|
'uge': 245,
|
||||||
|
' di': 246,
|
||||||
|
'ag ': 247,
|
||||||
|
'd a': 248,
|
||||||
|
'g i': 249,
|
||||||
|
'ill': 250,
|
||||||
|
'l a': 251,
|
||||||
|
'lsk': 252,
|
||||||
|
'n a': 253,
|
||||||
|
'on ': 254,
|
||||||
|
'sam': 255,
|
||||||
|
'str': 256,
|
||||||
|
'tet': 257,
|
||||||
|
'var': 258,
|
||||||
|
' mo': 259,
|
||||||
|
'art': 260,
|
||||||
|
'ash': 261,
|
||||||
|
'att': 262,
|
||||||
|
'e b': 263,
|
||||||
|
'han': 264,
|
||||||
|
'hav': 265,
|
||||||
|
'kla': 266,
|
||||||
|
'kon': 267,
|
||||||
|
'n t': 268,
|
||||||
|
'ned': 269,
|
||||||
|
'r o': 270,
|
||||||
|
'ra ': 271,
|
||||||
|
'rre': 272,
|
||||||
|
'ves': 273,
|
||||||
|
'vil': 274,
|
||||||
|
' el': 275,
|
||||||
|
' kr': 276,
|
||||||
|
' ov': 277,
|
||||||
|
'ann': 278,
|
||||||
|
'e u': 279,
|
||||||
|
'ess': 280,
|
||||||
|
'fra': 281,
|
||||||
|
'g a': 282,
|
||||||
|
'g d': 283,
|
||||||
|
'int': 284,
|
||||||
|
'ngs': 285,
|
||||||
|
'rde': 286,
|
||||||
|
'tra': 287,
|
||||||
|
' år': 288,
|
||||||
|
'akt': 289,
|
||||||
|
'asi': 290,
|
||||||
|
'em ': 291,
|
||||||
|
'gel': 292,
|
||||||
|
'gym': 293,
|
||||||
|
'hol': 294,
|
||||||
|
'kan': 295,
|
||||||
|
'mna': 296,
|
||||||
|
'n h': 297,
|
||||||
|
'nsk': 298,
|
||||||
|
'old': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/de.py
Normal file
303
libs/guess_language/data/models/de.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'en ': 0,
|
||||||
|
'er ': 1,
|
||||||
|
' de': 2,
|
||||||
|
'der': 3,
|
||||||
|
'ie ': 4,
|
||||||
|
' di': 5,
|
||||||
|
'die': 6,
|
||||||
|
'sch': 7,
|
||||||
|
'ein': 8,
|
||||||
|
'che': 9,
|
||||||
|
'ich': 10,
|
||||||
|
'den': 11,
|
||||||
|
'in ': 12,
|
||||||
|
'te ': 13,
|
||||||
|
'ch ': 14,
|
||||||
|
' ei': 15,
|
||||||
|
'ung': 16,
|
||||||
|
'n d': 17,
|
||||||
|
'nd ': 18,
|
||||||
|
' be': 19,
|
||||||
|
'ver': 20,
|
||||||
|
'es ': 21,
|
||||||
|
' zu': 22,
|
||||||
|
'eit': 23,
|
||||||
|
'gen': 24,
|
||||||
|
'und': 25,
|
||||||
|
' un': 26,
|
||||||
|
' au': 27,
|
||||||
|
' in': 28,
|
||||||
|
'cht': 29,
|
||||||
|
'it ': 30,
|
||||||
|
'ten': 31,
|
||||||
|
' da': 32,
|
||||||
|
'ent': 33,
|
||||||
|
' ve': 34,
|
||||||
|
'and': 35,
|
||||||
|
' ge': 36,
|
||||||
|
'ine': 37,
|
||||||
|
' mi': 38,
|
||||||
|
'r d': 39,
|
||||||
|
'hen': 40,
|
||||||
|
'ng ': 41,
|
||||||
|
'nde': 42,
|
||||||
|
' vo': 43,
|
||||||
|
'e d': 44,
|
||||||
|
'ber': 45,
|
||||||
|
'men': 46,
|
||||||
|
'ei ': 47,
|
||||||
|
'mit': 48,
|
||||||
|
' st': 49,
|
||||||
|
'ter': 50,
|
||||||
|
'ren': 51,
|
||||||
|
't d': 52,
|
||||||
|
' er': 53,
|
||||||
|
'ere': 54,
|
||||||
|
'n s': 55,
|
||||||
|
'ste': 56,
|
||||||
|
' se': 57,
|
||||||
|
'e s': 58,
|
||||||
|
'ht ': 59,
|
||||||
|
'des': 60,
|
||||||
|
'ist': 61,
|
||||||
|
'ne ': 62,
|
||||||
|
'auf': 63,
|
||||||
|
'e a': 64,
|
||||||
|
'isc': 65,
|
||||||
|
'on ': 66,
|
||||||
|
'rte': 67,
|
||||||
|
' re': 68,
|
||||||
|
' we': 69,
|
||||||
|
'ges': 70,
|
||||||
|
'uch': 71,
|
||||||
|
' fü': 72,
|
||||||
|
' so': 73,
|
||||||
|
'bei': 74,
|
||||||
|
'e e': 75,
|
||||||
|
'nen': 76,
|
||||||
|
'r s': 77,
|
||||||
|
'ach': 78,
|
||||||
|
'für': 79,
|
||||||
|
'ier': 80,
|
||||||
|
'par': 81,
|
||||||
|
'ür ': 82,
|
||||||
|
' ha': 83,
|
||||||
|
'as ': 84,
|
||||||
|
'ert': 85,
|
||||||
|
' an': 86,
|
||||||
|
' pa': 87,
|
||||||
|
' sa': 88,
|
||||||
|
' sp': 89,
|
||||||
|
' wi': 90,
|
||||||
|
'for': 91,
|
||||||
|
'tag': 92,
|
||||||
|
'zu ': 93,
|
||||||
|
'das': 94,
|
||||||
|
'rei': 95,
|
||||||
|
'he ': 96,
|
||||||
|
'hre': 97,
|
||||||
|
'nte': 98,
|
||||||
|
'sen': 99,
|
||||||
|
'vor': 100,
|
||||||
|
' sc': 101,
|
||||||
|
'ech': 102,
|
||||||
|
'etz': 103,
|
||||||
|
'hei': 104,
|
||||||
|
'lan': 105,
|
||||||
|
'n a': 106,
|
||||||
|
'pd ': 107,
|
||||||
|
'st ': 108,
|
||||||
|
'sta': 109,
|
||||||
|
'ese': 110,
|
||||||
|
'lic': 111,
|
||||||
|
' ab': 112,
|
||||||
|
' si': 113,
|
||||||
|
'gte': 114,
|
||||||
|
' wa': 115,
|
||||||
|
'iti': 116,
|
||||||
|
'kei': 117,
|
||||||
|
'n e': 118,
|
||||||
|
'nge': 119,
|
||||||
|
'sei': 120,
|
||||||
|
'tra': 121,
|
||||||
|
'zen': 122,
|
||||||
|
' im': 123,
|
||||||
|
' la': 124,
|
||||||
|
'art': 125,
|
||||||
|
'im ': 126,
|
||||||
|
'lle': 127,
|
||||||
|
'n w': 128,
|
||||||
|
'rde': 129,
|
||||||
|
'rec': 130,
|
||||||
|
'set': 131,
|
||||||
|
'str': 132,
|
||||||
|
'tei': 133,
|
||||||
|
'tte': 134,
|
||||||
|
' ni': 135,
|
||||||
|
'e p': 136,
|
||||||
|
'ehe': 137,
|
||||||
|
'ers': 138,
|
||||||
|
'g d': 139,
|
||||||
|
'nic': 140,
|
||||||
|
'von': 141,
|
||||||
|
' al': 142,
|
||||||
|
' pr': 143,
|
||||||
|
'an ': 144,
|
||||||
|
'aus': 145,
|
||||||
|
'erf': 146,
|
||||||
|
'r e': 147,
|
||||||
|
'tze': 148,
|
||||||
|
'tür': 149,
|
||||||
|
'uf ': 150,
|
||||||
|
'ag ': 151,
|
||||||
|
'als': 152,
|
||||||
|
'ar ': 153,
|
||||||
|
'chs': 154,
|
||||||
|
'end': 155,
|
||||||
|
'ge ': 156,
|
||||||
|
'ige': 157,
|
||||||
|
'ion': 158,
|
||||||
|
'ls ': 159,
|
||||||
|
'n m': 160,
|
||||||
|
'ngs': 161,
|
||||||
|
'nis': 162,
|
||||||
|
'nt ': 163,
|
||||||
|
'ord': 164,
|
||||||
|
's s': 165,
|
||||||
|
'sse': 166,
|
||||||
|
' tü': 167,
|
||||||
|
'ahl': 168,
|
||||||
|
'e b': 169,
|
||||||
|
'ede': 170,
|
||||||
|
'em ': 171,
|
||||||
|
'len': 172,
|
||||||
|
'n i': 173,
|
||||||
|
'orm': 174,
|
||||||
|
'pro': 175,
|
||||||
|
'rke': 176,
|
||||||
|
'run': 177,
|
||||||
|
's d': 178,
|
||||||
|
'wah': 179,
|
||||||
|
'wer': 180,
|
||||||
|
'ürk': 181,
|
||||||
|
' me': 182,
|
||||||
|
'age': 183,
|
||||||
|
'att': 184,
|
||||||
|
'ell': 185,
|
||||||
|
'est': 186,
|
||||||
|
'hat': 187,
|
||||||
|
'n b': 188,
|
||||||
|
'oll': 189,
|
||||||
|
'raf': 190,
|
||||||
|
's a': 191,
|
||||||
|
'tsc': 192,
|
||||||
|
' es': 193,
|
||||||
|
' fo': 194,
|
||||||
|
' gr': 195,
|
||||||
|
' ja': 196,
|
||||||
|
'abe': 197,
|
||||||
|
'auc': 198,
|
||||||
|
'ben': 199,
|
||||||
|
'e n': 200,
|
||||||
|
'ege': 201,
|
||||||
|
'lie': 202,
|
||||||
|
'n u': 203,
|
||||||
|
'r v': 204,
|
||||||
|
're ': 205,
|
||||||
|
'rit': 206,
|
||||||
|
'sag': 207,
|
||||||
|
' am': 208,
|
||||||
|
'agt': 209,
|
||||||
|
'ahr': 210,
|
||||||
|
'bra': 211,
|
||||||
|
'de ': 212,
|
||||||
|
'erd': 213,
|
||||||
|
'her': 214,
|
||||||
|
'ite': 215,
|
||||||
|
'le ': 216,
|
||||||
|
'n p': 217,
|
||||||
|
'n v': 218,
|
||||||
|
'or ': 219,
|
||||||
|
'rbe': 220,
|
||||||
|
'rt ': 221,
|
||||||
|
'sic': 222,
|
||||||
|
'wie': 223,
|
||||||
|
'übe': 224,
|
||||||
|
' is': 225,
|
||||||
|
' üb': 226,
|
||||||
|
'cha': 227,
|
||||||
|
'chi': 228,
|
||||||
|
'e f': 229,
|
||||||
|
'e m': 230,
|
||||||
|
'eri': 231,
|
||||||
|
'ied': 232,
|
||||||
|
'mme': 233,
|
||||||
|
'ner': 234,
|
||||||
|
'r a': 235,
|
||||||
|
'sti': 236,
|
||||||
|
't a': 237,
|
||||||
|
't s': 238,
|
||||||
|
'tis': 239,
|
||||||
|
' ko': 240,
|
||||||
|
'arb': 241,
|
||||||
|
'ds ': 242,
|
||||||
|
'gan': 243,
|
||||||
|
'n z': 244,
|
||||||
|
'r f': 245,
|
||||||
|
'r w': 246,
|
||||||
|
'ran': 247,
|
||||||
|
'se ': 248,
|
||||||
|
't i': 249,
|
||||||
|
'wei': 250,
|
||||||
|
'wir': 251,
|
||||||
|
' br': 252,
|
||||||
|
' np': 253,
|
||||||
|
'am ': 254,
|
||||||
|
'bes': 255,
|
||||||
|
'd d': 256,
|
||||||
|
'deu': 257,
|
||||||
|
'e g': 258,
|
||||||
|
'e k': 259,
|
||||||
|
'efo': 260,
|
||||||
|
'et ': 261,
|
||||||
|
'eut': 262,
|
||||||
|
'fen': 263,
|
||||||
|
'hse': 264,
|
||||||
|
'lte': 265,
|
||||||
|
'n r': 266,
|
||||||
|
'npd': 267,
|
||||||
|
'r b': 268,
|
||||||
|
'rhe': 269,
|
||||||
|
't w': 270,
|
||||||
|
'tz ': 271,
|
||||||
|
' fr': 272,
|
||||||
|
' ih': 273,
|
||||||
|
' ke': 274,
|
||||||
|
' ma': 275,
|
||||||
|
'ame': 276,
|
||||||
|
'ang': 277,
|
||||||
|
'd s': 278,
|
||||||
|
'eil': 279,
|
||||||
|
'el ': 280,
|
||||||
|
'era': 281,
|
||||||
|
'erh': 282,
|
||||||
|
'h d': 283,
|
||||||
|
'i d': 284,
|
||||||
|
'kan': 285,
|
||||||
|
'n f': 286,
|
||||||
|
'n l': 287,
|
||||||
|
'nts': 288,
|
||||||
|
'och': 289,
|
||||||
|
'rag': 290,
|
||||||
|
'rd ': 291,
|
||||||
|
'spd': 292,
|
||||||
|
'spr': 293,
|
||||||
|
'tio': 294,
|
||||||
|
' ar': 295,
|
||||||
|
' en': 296,
|
||||||
|
' ka': 297,
|
||||||
|
'ark': 298,
|
||||||
|
'ass': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/en.py
Normal file
303
libs/guess_language/data/models/en.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
' th': 0,
|
||||||
|
'the': 1,
|
||||||
|
'he ': 2,
|
||||||
|
'ed ': 3,
|
||||||
|
' to': 4,
|
||||||
|
' in': 5,
|
||||||
|
'er ': 6,
|
||||||
|
'ing': 7,
|
||||||
|
'ng ': 8,
|
||||||
|
' an': 9,
|
||||||
|
'nd ': 10,
|
||||||
|
' of': 11,
|
||||||
|
'and': 12,
|
||||||
|
'to ': 13,
|
||||||
|
'of ': 14,
|
||||||
|
' co': 15,
|
||||||
|
'at ': 16,
|
||||||
|
'on ': 17,
|
||||||
|
'in ': 18,
|
||||||
|
' a ': 19,
|
||||||
|
'd t': 20,
|
||||||
|
' he': 21,
|
||||||
|
'e t': 22,
|
||||||
|
'ion': 23,
|
||||||
|
'es ': 24,
|
||||||
|
' re': 25,
|
||||||
|
're ': 26,
|
||||||
|
'hat': 27,
|
||||||
|
' sa': 28,
|
||||||
|
' st': 29,
|
||||||
|
' ha': 30,
|
||||||
|
'her': 31,
|
||||||
|
'tha': 32,
|
||||||
|
'tio': 33,
|
||||||
|
'or ': 34,
|
||||||
|
" ''": 35,
|
||||||
|
'en ': 36,
|
||||||
|
' wh': 37,
|
||||||
|
'e s': 38,
|
||||||
|
'ent': 39,
|
||||||
|
'n t': 40,
|
||||||
|
's a': 41,
|
||||||
|
'as ': 42,
|
||||||
|
'for': 43,
|
||||||
|
'is ': 44,
|
||||||
|
't t': 45,
|
||||||
|
' be': 46,
|
||||||
|
'ld ': 47,
|
||||||
|
'e a': 48,
|
||||||
|
'rs ': 49,
|
||||||
|
' wa': 50,
|
||||||
|
'ut ': 51,
|
||||||
|
've ': 52,
|
||||||
|
'll ': 53,
|
||||||
|
'al ': 54,
|
||||||
|
' ma': 55,
|
||||||
|
'e i': 56,
|
||||||
|
' fo': 57,
|
||||||
|
"'s ": 58,
|
||||||
|
'an ': 59,
|
||||||
|
'est': 60,
|
||||||
|
' hi': 61,
|
||||||
|
' mo': 62,
|
||||||
|
' se': 63,
|
||||||
|
' pr': 64,
|
||||||
|
's t': 65,
|
||||||
|
'ate': 66,
|
||||||
|
'st ': 67,
|
||||||
|
'ter': 68,
|
||||||
|
'ere': 69,
|
||||||
|
'ted': 70,
|
||||||
|
'nt ': 71,
|
||||||
|
'ver': 72,
|
||||||
|
'd a': 73,
|
||||||
|
' wi': 74,
|
||||||
|
'se ': 75,
|
||||||
|
'e c': 76,
|
||||||
|
'ect': 77,
|
||||||
|
'ns ': 78,
|
||||||
|
' on': 79,
|
||||||
|
'ly ': 80,
|
||||||
|
'tol': 81,
|
||||||
|
'ey ': 82,
|
||||||
|
'r t': 83,
|
||||||
|
' ca': 84,
|
||||||
|
'ati': 85,
|
||||||
|
'ts ': 86,
|
||||||
|
'all': 87,
|
||||||
|
' no': 88,
|
||||||
|
'his': 89,
|
||||||
|
's o': 90,
|
||||||
|
'ers': 91,
|
||||||
|
'con': 92,
|
||||||
|
'e o': 93,
|
||||||
|
'ear': 94,
|
||||||
|
'f t': 95,
|
||||||
|
'e w': 96,
|
||||||
|
'was': 97,
|
||||||
|
'ons': 98,
|
||||||
|
'sta': 99,
|
||||||
|
"'' ": 100,
|
||||||
|
'sti': 101,
|
||||||
|
'n a': 102,
|
||||||
|
'sto': 103,
|
||||||
|
't h': 104,
|
||||||
|
' we': 105,
|
||||||
|
'id ': 106,
|
||||||
|
'th ': 107,
|
||||||
|
' it': 108,
|
||||||
|
'ce ': 109,
|
||||||
|
' di': 110,
|
||||||
|
'ave': 111,
|
||||||
|
'd h': 112,
|
||||||
|
'cou': 113,
|
||||||
|
'pro': 114,
|
||||||
|
'ad ': 115,
|
||||||
|
'oll': 116,
|
||||||
|
'ry ': 117,
|
||||||
|
'd s': 118,
|
||||||
|
'e m': 119,
|
||||||
|
' so': 120,
|
||||||
|
'ill': 121,
|
||||||
|
'cti': 122,
|
||||||
|
'te ': 123,
|
||||||
|
'tor': 124,
|
||||||
|
'eve': 125,
|
||||||
|
'g t': 126,
|
||||||
|
'it ': 127,
|
||||||
|
' ch': 128,
|
||||||
|
' de': 129,
|
||||||
|
'hav': 130,
|
||||||
|
'oul': 131,
|
||||||
|
'ty ': 132,
|
||||||
|
'uld': 133,
|
||||||
|
'use': 134,
|
||||||
|
' al': 135,
|
||||||
|
'are': 136,
|
||||||
|
'ch ': 137,
|
||||||
|
'me ': 138,
|
||||||
|
'out': 139,
|
||||||
|
'ove': 140,
|
||||||
|
'wit': 141,
|
||||||
|
'ys ': 142,
|
||||||
|
'chi': 143,
|
||||||
|
't a': 144,
|
||||||
|
'ith': 145,
|
||||||
|
'oth': 146,
|
||||||
|
' ab': 147,
|
||||||
|
' te': 148,
|
||||||
|
' wo': 149,
|
||||||
|
's s': 150,
|
||||||
|
'res': 151,
|
||||||
|
't w': 152,
|
||||||
|
'tin': 153,
|
||||||
|
'e b': 154,
|
||||||
|
'e h': 155,
|
||||||
|
'nce': 156,
|
||||||
|
't s': 157,
|
||||||
|
'y t': 158,
|
||||||
|
'e p': 159,
|
||||||
|
'ele': 160,
|
||||||
|
'hin': 161,
|
||||||
|
's i': 162,
|
||||||
|
'nte': 163,
|
||||||
|
' li': 164,
|
||||||
|
'le ': 165,
|
||||||
|
' do': 166,
|
||||||
|
'aid': 167,
|
||||||
|
'hey': 168,
|
||||||
|
'ne ': 169,
|
||||||
|
's w': 170,
|
||||||
|
' as': 171,
|
||||||
|
' fr': 172,
|
||||||
|
' tr': 173,
|
||||||
|
'end': 174,
|
||||||
|
'sai': 175,
|
||||||
|
' el': 176,
|
||||||
|
' ne': 177,
|
||||||
|
' su': 178,
|
||||||
|
"'t ": 179,
|
||||||
|
'ay ': 180,
|
||||||
|
'hou': 181,
|
||||||
|
'ive': 182,
|
||||||
|
'lec': 183,
|
||||||
|
"n't": 184,
|
||||||
|
' ye': 185,
|
||||||
|
'but': 186,
|
||||||
|
'd o': 187,
|
||||||
|
'o t': 188,
|
||||||
|
'y o': 189,
|
||||||
|
' ho': 190,
|
||||||
|
' me': 191,
|
||||||
|
'be ': 192,
|
||||||
|
'cal': 193,
|
||||||
|
'e e': 194,
|
||||||
|
'had': 195,
|
||||||
|
'ple': 196,
|
||||||
|
' at': 197,
|
||||||
|
' bu': 198,
|
||||||
|
' la': 199,
|
||||||
|
'd b': 200,
|
||||||
|
's h': 201,
|
||||||
|
'say': 202,
|
||||||
|
't i': 203,
|
||||||
|
' ar': 204,
|
||||||
|
'e f': 205,
|
||||||
|
'ght': 206,
|
||||||
|
'hil': 207,
|
||||||
|
'igh': 208,
|
||||||
|
'int': 209,
|
||||||
|
'not': 210,
|
||||||
|
'ren': 211,
|
||||||
|
' is': 212,
|
||||||
|
' pa': 213,
|
||||||
|
' sh': 214,
|
||||||
|
'ays': 215,
|
||||||
|
'com': 216,
|
||||||
|
'n s': 217,
|
||||||
|
'r a': 218,
|
||||||
|
'rin': 219,
|
||||||
|
'y a': 220,
|
||||||
|
' un': 221,
|
||||||
|
'n c': 222,
|
||||||
|
'om ': 223,
|
||||||
|
'thi': 224,
|
||||||
|
' mi': 225,
|
||||||
|
'by ': 226,
|
||||||
|
'd i': 227,
|
||||||
|
'e d': 228,
|
||||||
|
'e n': 229,
|
||||||
|
't o': 230,
|
||||||
|
' by': 231,
|
||||||
|
'e r': 232,
|
||||||
|
'eri': 233,
|
||||||
|
'old': 234,
|
||||||
|
'ome': 235,
|
||||||
|
'whe': 236,
|
||||||
|
'yea': 237,
|
||||||
|
' gr': 238,
|
||||||
|
'ar ': 239,
|
||||||
|
'ity': 240,
|
||||||
|
'mpl': 241,
|
||||||
|
'oun': 242,
|
||||||
|
'one': 243,
|
||||||
|
'ow ': 244,
|
||||||
|
'r s': 245,
|
||||||
|
's f': 246,
|
||||||
|
'tat': 247,
|
||||||
|
' ba': 248,
|
||||||
|
' vo': 249,
|
||||||
|
'bou': 250,
|
||||||
|
'sam': 251,
|
||||||
|
'tim': 252,
|
||||||
|
'vot': 253,
|
||||||
|
'abo': 254,
|
||||||
|
'ant': 255,
|
||||||
|
'ds ': 256,
|
||||||
|
'ial': 257,
|
||||||
|
'ine': 258,
|
||||||
|
'man': 259,
|
||||||
|
'men': 260,
|
||||||
|
' or': 261,
|
||||||
|
' po': 262,
|
||||||
|
'amp': 263,
|
||||||
|
'can': 264,
|
||||||
|
'der': 265,
|
||||||
|
'e l': 266,
|
||||||
|
'les': 267,
|
||||||
|
'ny ': 268,
|
||||||
|
'ot ': 269,
|
||||||
|
'rec': 270,
|
||||||
|
'tes': 271,
|
||||||
|
'tho': 272,
|
||||||
|
'ica': 273,
|
||||||
|
'ild': 274,
|
||||||
|
'ir ': 275,
|
||||||
|
'nde': 276,
|
||||||
|
'ose': 277,
|
||||||
|
'ous': 278,
|
||||||
|
'pre': 279,
|
||||||
|
'ste': 280,
|
||||||
|
'era': 281,
|
||||||
|
'per': 282,
|
||||||
|
'r o': 283,
|
||||||
|
'red': 284,
|
||||||
|
'rie': 285,
|
||||||
|
' bo': 286,
|
||||||
|
' le': 287,
|
||||||
|
'ali': 288,
|
||||||
|
'ars': 289,
|
||||||
|
'ore': 290,
|
||||||
|
'ric': 291,
|
||||||
|
's m': 292,
|
||||||
|
'str': 293,
|
||||||
|
' fa': 294,
|
||||||
|
'ess': 295,
|
||||||
|
'ie ': 296,
|
||||||
|
'ist': 297,
|
||||||
|
'lat': 298,
|
||||||
|
'uri': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/eo.py
Normal file
303
libs/guess_language/data/models/eo.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
' la': 0,
|
||||||
|
'la ': 1,
|
||||||
|
' de': 2,
|
||||||
|
'de ': 3,
|
||||||
|
'aj ': 4,
|
||||||
|
'oj ': 5,
|
||||||
|
'as ': 6,
|
||||||
|
'is ': 7,
|
||||||
|
'en ': 8,
|
||||||
|
' en': 9,
|
||||||
|
' ka': 10,
|
||||||
|
'est': 11,
|
||||||
|
'o d': 12,
|
||||||
|
' es': 13,
|
||||||
|
'kaj': 14,
|
||||||
|
'e l': 15,
|
||||||
|
'to ': 16,
|
||||||
|
'sta': 17,
|
||||||
|
'o e': 18,
|
||||||
|
'io ': 19,
|
||||||
|
'o k': 20,
|
||||||
|
'on ': 21,
|
||||||
|
' ko': 22,
|
||||||
|
'ro ': 23,
|
||||||
|
'ta ': 24,
|
||||||
|
'tas': 25,
|
||||||
|
' al': 26,
|
||||||
|
'a k': 27,
|
||||||
|
' pr': 28,
|
||||||
|
'n l': 29,
|
||||||
|
'a a': 30,
|
||||||
|
' po': 31,
|
||||||
|
' ki': 32,
|
||||||
|
' ma': 33,
|
||||||
|
'o l': 34,
|
||||||
|
'jn ': 35,
|
||||||
|
'ant': 36,
|
||||||
|
' li': 37,
|
||||||
|
'a p': 38,
|
||||||
|
'ist': 39,
|
||||||
|
's l': 40,
|
||||||
|
'nto': 41,
|
||||||
|
'sti': 42,
|
||||||
|
'j k': 43,
|
||||||
|
'no ': 44,
|
||||||
|
'ita': 45,
|
||||||
|
'tis': 46,
|
||||||
|
'do ': 47,
|
||||||
|
'an ': 48,
|
||||||
|
'ent': 49,
|
||||||
|
' re': 50,
|
||||||
|
'aŭ ': 51,
|
||||||
|
'j e': 52,
|
||||||
|
'kon': 53,
|
||||||
|
'li ': 54,
|
||||||
|
'toj': 55,
|
||||||
|
'ran': 56,
|
||||||
|
'n k': 57,
|
||||||
|
' ti': 58,
|
||||||
|
's e': 59,
|
||||||
|
'el ': 60,
|
||||||
|
'al ': 61,
|
||||||
|
'a s': 62,
|
||||||
|
' in': 63,
|
||||||
|
'ter': 64,
|
||||||
|
'aro': 65,
|
||||||
|
' an': 66,
|
||||||
|
'a m': 67,
|
||||||
|
'a e': 68,
|
||||||
|
'ia ': 69,
|
||||||
|
'n d': 70,
|
||||||
|
'ojn': 71,
|
||||||
|
'per': 72,
|
||||||
|
' su': 73,
|
||||||
|
'j d': 74,
|
||||||
|
' se': 75,
|
||||||
|
'nta': 76,
|
||||||
|
'str': 77,
|
||||||
|
'sto': 78,
|
||||||
|
'a l': 79,
|
||||||
|
' pl': 80,
|
||||||
|
'mo ': 81,
|
||||||
|
'a d': 82,
|
||||||
|
' ĝi': 83,
|
||||||
|
' si': 84,
|
||||||
|
' tr': 85,
|
||||||
|
'and': 86,
|
||||||
|
's k': 87,
|
||||||
|
'o p': 88,
|
||||||
|
'lo ': 89,
|
||||||
|
'j l': 90,
|
||||||
|
'tra': 91,
|
||||||
|
'par': 92,
|
||||||
|
' pa': 93,
|
||||||
|
'unu': 94,
|
||||||
|
'pro': 95,
|
||||||
|
'ono': 96,
|
||||||
|
'o a': 97,
|
||||||
|
'nte': 98,
|
||||||
|
'j p': 99,
|
||||||
|
' no': 100,
|
||||||
|
' ku': 101,
|
||||||
|
'te ': 102,
|
||||||
|
'mal': 103,
|
||||||
|
'taj': 104,
|
||||||
|
' el': 105,
|
||||||
|
'kom': 106,
|
||||||
|
'iu ': 107,
|
||||||
|
'art': 108,
|
||||||
|
'roj': 109,
|
||||||
|
' ja': 110,
|
||||||
|
'ĝis': 111,
|
||||||
|
' mo': 112,
|
||||||
|
'lan': 113,
|
||||||
|
'ra ': 114,
|
||||||
|
'a r': 115,
|
||||||
|
's a': 116,
|
||||||
|
' vi': 117,
|
||||||
|
'era': 118,
|
||||||
|
'tro': 119,
|
||||||
|
'gra': 120,
|
||||||
|
'er ': 121,
|
||||||
|
'e k': 122,
|
||||||
|
'ori': 123,
|
||||||
|
'n e': 124,
|
||||||
|
' di': 125,
|
||||||
|
'ata': 126,
|
||||||
|
'int': 127,
|
||||||
|
's p': 128,
|
||||||
|
'o s': 129,
|
||||||
|
'a f': 130,
|
||||||
|
'ko ': 131,
|
||||||
|
'a t': 132,
|
||||||
|
'j a': 133,
|
||||||
|
'n p': 134,
|
||||||
|
' ek': 135,
|
||||||
|
'kiu': 136,
|
||||||
|
'na ': 137,
|
||||||
|
'ne ': 138,
|
||||||
|
' pe': 139,
|
||||||
|
'e e': 140,
|
||||||
|
'e d': 141,
|
||||||
|
'da ': 142,
|
||||||
|
'ili': 143,
|
||||||
|
'l l': 144,
|
||||||
|
'ado': 145,
|
||||||
|
'ank': 146,
|
||||||
|
'ver': 147,
|
||||||
|
'por': 148,
|
||||||
|
'men': 149,
|
||||||
|
'e a': 150,
|
||||||
|
' ne': 151,
|
||||||
|
'man': 152,
|
||||||
|
' me': 153,
|
||||||
|
' du': 154,
|
||||||
|
'un ': 155,
|
||||||
|
' un': 156,
|
||||||
|
'ato': 157,
|
||||||
|
'kun': 158,
|
||||||
|
'mon': 159,
|
||||||
|
'ali': 160,
|
||||||
|
'ste': 161,
|
||||||
|
'ajn': 162,
|
||||||
|
'dis': 163,
|
||||||
|
'tri': 164,
|
||||||
|
'rio': 165,
|
||||||
|
'j s': 166,
|
||||||
|
' lo': 167,
|
||||||
|
'ara': 168,
|
||||||
|
'pre': 169,
|
||||||
|
' te': 170,
|
||||||
|
' gr': 171,
|
||||||
|
'oni': 172,
|
||||||
|
'kie': 173,
|
||||||
|
'nom': 174,
|
||||||
|
'jar': 175,
|
||||||
|
'nda': 176,
|
||||||
|
'i e': 177,
|
||||||
|
'ĝi ': 178,
|
||||||
|
'noj': 179,
|
||||||
|
'kto': 180,
|
||||||
|
'ero': 181,
|
||||||
|
'n s': 182,
|
||||||
|
'igi': 183,
|
||||||
|
'cio': 184,
|
||||||
|
'e s': 185,
|
||||||
|
'a v': 186,
|
||||||
|
'a n': 187,
|
||||||
|
'or ': 188,
|
||||||
|
'pri': 189,
|
||||||
|
'e p': 190,
|
||||||
|
' fo': 191,
|
||||||
|
' ĉe': 192,
|
||||||
|
'iĝi': 193,
|
||||||
|
's s': 194,
|
||||||
|
'n a': 195,
|
||||||
|
' ha': 196,
|
||||||
|
'eri': 197,
|
||||||
|
' ar': 198,
|
||||||
|
'ndo': 199,
|
||||||
|
'a u': 200,
|
||||||
|
'ont': 201,
|
||||||
|
'ano': 202,
|
||||||
|
'lia': 203,
|
||||||
|
'iel': 204,
|
||||||
|
'ost': 205,
|
||||||
|
'ris': 206,
|
||||||
|
' fa': 207,
|
||||||
|
'ort': 208,
|
||||||
|
'iko': 209,
|
||||||
|
'lin': 210,
|
||||||
|
'ari': 211,
|
||||||
|
' ĉi': 212,
|
||||||
|
'ri ': 213,
|
||||||
|
'iaj': 214,
|
||||||
|
'ion': 215,
|
||||||
|
'mun': 216,
|
||||||
|
' ve': 217,
|
||||||
|
'ino': 218,
|
||||||
|
'tor': 219,
|
||||||
|
' sa': 220,
|
||||||
|
'loj': 221,
|
||||||
|
'co ': 222,
|
||||||
|
'nis': 223,
|
||||||
|
'ton': 224,
|
||||||
|
' aŭ': 225,
|
||||||
|
'e m': 226,
|
||||||
|
'ona': 227,
|
||||||
|
'rto': 228,
|
||||||
|
'aci': 229,
|
||||||
|
'spe': 230,
|
||||||
|
'ala': 231,
|
||||||
|
'ple': 232,
|
||||||
|
'for': 233,
|
||||||
|
'o t': 234,
|
||||||
|
'vas': 235,
|
||||||
|
'olo': 236,
|
||||||
|
'tiu': 237,
|
||||||
|
'jo ': 238,
|
||||||
|
'pos': 239,
|
||||||
|
'kaŭ': 240,
|
||||||
|
're ': 241,
|
||||||
|
'j m': 242,
|
||||||
|
'nio': 243,
|
||||||
|
' fi': 244,
|
||||||
|
' st': 245,
|
||||||
|
'o m': 246,
|
||||||
|
' ba': 247,
|
||||||
|
'tan': 248,
|
||||||
|
'a j': 249,
|
||||||
|
'ekt': 250,
|
||||||
|
' ge': 251,
|
||||||
|
'ons': 252,
|
||||||
|
's m': 253,
|
||||||
|
'omo': 254,
|
||||||
|
'ing': 255,
|
||||||
|
' mi': 256,
|
||||||
|
'omu': 257,
|
||||||
|
'a b': 258,
|
||||||
|
'a i': 259,
|
||||||
|
'ten': 260,
|
||||||
|
'enc': 261,
|
||||||
|
'res': 262,
|
||||||
|
'ika': 263,
|
||||||
|
'rbo': 264,
|
||||||
|
'vis': 265,
|
||||||
|
'nka': 266,
|
||||||
|
'pli': 267,
|
||||||
|
' a ': 268,
|
||||||
|
' mu': 269,
|
||||||
|
'iuj': 270,
|
||||||
|
'tem': 271,
|
||||||
|
'hav': 272,
|
||||||
|
' kr': 273,
|
||||||
|
' na': 274,
|
||||||
|
'ila': 275,
|
||||||
|
'alo': 276,
|
||||||
|
' ke': 277,
|
||||||
|
'aĵo': 278,
|
||||||
|
'umo': 279,
|
||||||
|
'i l': 280,
|
||||||
|
'ani': 281,
|
||||||
|
'ova': 282,
|
||||||
|
'num': 283,
|
||||||
|
'r l': 284,
|
||||||
|
'urb': 285,
|
||||||
|
'ron': 286,
|
||||||
|
' ap': 287,
|
||||||
|
'am ': 288,
|
||||||
|
'tat': 289,
|
||||||
|
'tur': 290,
|
||||||
|
'cia': 291,
|
||||||
|
' ri': 292,
|
||||||
|
'ovi': 293,
|
||||||
|
'ava': 294,
|
||||||
|
'ntr': 295,
|
||||||
|
' or': 296,
|
||||||
|
'ejo': 297,
|
||||||
|
'nst': 298,
|
||||||
|
'ka ': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/es.py
Normal file
303
libs/guess_language/data/models/es.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
' de': 0,
|
||||||
|
'de ': 1,
|
||||||
|
' la': 2,
|
||||||
|
'os ': 3,
|
||||||
|
'la ': 4,
|
||||||
|
'el ': 5,
|
||||||
|
'es ': 6,
|
||||||
|
' qu': 7,
|
||||||
|
' co': 8,
|
||||||
|
'e l': 9,
|
||||||
|
'as ': 10,
|
||||||
|
'que': 11,
|
||||||
|
' el': 12,
|
||||||
|
'ue ': 13,
|
||||||
|
'en ': 14,
|
||||||
|
'ent': 15,
|
||||||
|
' en': 16,
|
||||||
|
' se': 17,
|
||||||
|
'nte': 18,
|
||||||
|
'res': 19,
|
||||||
|
'con': 20,
|
||||||
|
'est': 21,
|
||||||
|
' es': 22,
|
||||||
|
's d': 23,
|
||||||
|
' lo': 24,
|
||||||
|
' pr': 25,
|
||||||
|
'los': 26,
|
||||||
|
' y ': 27,
|
||||||
|
'do ': 28,
|
||||||
|
'ón ': 29,
|
||||||
|
'ión': 30,
|
||||||
|
' un': 31,
|
||||||
|
'ció': 32,
|
||||||
|
'del': 33,
|
||||||
|
'o d': 34,
|
||||||
|
' po': 35,
|
||||||
|
'a d': 36,
|
||||||
|
'aci': 37,
|
||||||
|
'sta': 38,
|
||||||
|
'te ': 39,
|
||||||
|
'ado': 40,
|
||||||
|
'pre': 41,
|
||||||
|
'to ': 42,
|
||||||
|
'par': 43,
|
||||||
|
'a e': 44,
|
||||||
|
'a l': 45,
|
||||||
|
'ra ': 46,
|
||||||
|
'al ': 47,
|
||||||
|
'e e': 48,
|
||||||
|
'se ': 49,
|
||||||
|
'pro': 50,
|
||||||
|
'ar ': 51,
|
||||||
|
'ia ': 52,
|
||||||
|
'o e': 53,
|
||||||
|
' re': 54,
|
||||||
|
'ida': 55,
|
||||||
|
'dad': 56,
|
||||||
|
'tra': 57,
|
||||||
|
'por': 58,
|
||||||
|
's p': 59,
|
||||||
|
' a ': 60,
|
||||||
|
'a p': 61,
|
||||||
|
'ara': 62,
|
||||||
|
'cia': 63,
|
||||||
|
' pa': 64,
|
||||||
|
'com': 65,
|
||||||
|
'no ': 66,
|
||||||
|
' di': 67,
|
||||||
|
' in': 68,
|
||||||
|
'ien': 69,
|
||||||
|
'n l': 70,
|
||||||
|
'ad ': 71,
|
||||||
|
'ant': 72,
|
||||||
|
'e s': 73,
|
||||||
|
'men': 74,
|
||||||
|
'a c': 75,
|
||||||
|
'on ': 76,
|
||||||
|
'un ': 77,
|
||||||
|
'las': 78,
|
||||||
|
'nci': 79,
|
||||||
|
' tr': 80,
|
||||||
|
'cio': 81,
|
||||||
|
'ier': 82,
|
||||||
|
'nto': 83,
|
||||||
|
'tiv': 84,
|
||||||
|
'n d': 85,
|
||||||
|
'n e': 86,
|
||||||
|
'or ': 87,
|
||||||
|
's c': 88,
|
||||||
|
'enc': 89,
|
||||||
|
'ern': 90,
|
||||||
|
'io ': 91,
|
||||||
|
'a s': 92,
|
||||||
|
'ici': 93,
|
||||||
|
's e': 94,
|
||||||
|
' ma': 95,
|
||||||
|
'dos': 96,
|
||||||
|
'e a': 97,
|
||||||
|
'e c': 98,
|
||||||
|
'emp': 99,
|
||||||
|
'ica': 100,
|
||||||
|
'ivo': 101,
|
||||||
|
'l p': 102,
|
||||||
|
'n c': 103,
|
||||||
|
'r e': 104,
|
||||||
|
'ta ': 105,
|
||||||
|
'ter': 106,
|
||||||
|
'e d': 107,
|
||||||
|
'esa': 108,
|
||||||
|
'ez ': 109,
|
||||||
|
'mpr': 110,
|
||||||
|
'o a': 111,
|
||||||
|
's a': 112,
|
||||||
|
' ca': 113,
|
||||||
|
' su': 114,
|
||||||
|
'ion': 115,
|
||||||
|
' cu': 116,
|
||||||
|
' ju': 117,
|
||||||
|
'an ': 118,
|
||||||
|
'da ': 119,
|
||||||
|
'ene': 120,
|
||||||
|
'ero': 121,
|
||||||
|
'na ': 122,
|
||||||
|
'rec': 123,
|
||||||
|
'ro ': 124,
|
||||||
|
'tar': 125,
|
||||||
|
' al': 126,
|
||||||
|
' an': 127,
|
||||||
|
'bie': 128,
|
||||||
|
'e p': 129,
|
||||||
|
'er ': 130,
|
||||||
|
'l c': 131,
|
||||||
|
'n p': 132,
|
||||||
|
'omp': 133,
|
||||||
|
'ten': 134,
|
||||||
|
' em': 135,
|
||||||
|
'ist': 136,
|
||||||
|
'nes': 137,
|
||||||
|
'nta': 138,
|
||||||
|
'o c': 139,
|
||||||
|
'so ': 140,
|
||||||
|
'tes': 141,
|
||||||
|
'era': 142,
|
||||||
|
'l d': 143,
|
||||||
|
'l m': 144,
|
||||||
|
'les': 145,
|
||||||
|
'ntr': 146,
|
||||||
|
'o s': 147,
|
||||||
|
'ore': 148,
|
||||||
|
'rá ': 149,
|
||||||
|
's q': 150,
|
||||||
|
's y': 151,
|
||||||
|
'sto': 152,
|
||||||
|
'a a': 153,
|
||||||
|
'a r': 154,
|
||||||
|
'ari': 155,
|
||||||
|
'des': 156,
|
||||||
|
'e q': 157,
|
||||||
|
'ivi': 158,
|
||||||
|
'lic': 159,
|
||||||
|
'lo ': 160,
|
||||||
|
'n a': 161,
|
||||||
|
'one': 162,
|
||||||
|
'ora': 163,
|
||||||
|
'per': 164,
|
||||||
|
'pue': 165,
|
||||||
|
'r l': 166,
|
||||||
|
're ': 167,
|
||||||
|
'ren': 168,
|
||||||
|
'una': 169,
|
||||||
|
'ía ': 170,
|
||||||
|
'ada': 171,
|
||||||
|
'cas': 172,
|
||||||
|
'ere': 173,
|
||||||
|
'ide': 174,
|
||||||
|
'min': 175,
|
||||||
|
'n s': 176,
|
||||||
|
'ndo': 177,
|
||||||
|
'ran': 178,
|
||||||
|
'rno': 179,
|
||||||
|
' ac': 180,
|
||||||
|
' ex': 181,
|
||||||
|
' go': 182,
|
||||||
|
' no': 183,
|
||||||
|
'a t': 184,
|
||||||
|
'aba': 185,
|
||||||
|
'ble': 186,
|
||||||
|
'ece': 187,
|
||||||
|
'ect': 188,
|
||||||
|
'l a': 189,
|
||||||
|
'l g': 190,
|
||||||
|
'lid': 191,
|
||||||
|
'nsi': 192,
|
||||||
|
'ons': 193,
|
||||||
|
'rac': 194,
|
||||||
|
'rio': 195,
|
||||||
|
'str': 196,
|
||||||
|
'uer': 197,
|
||||||
|
'ust': 198,
|
||||||
|
' ha': 199,
|
||||||
|
' le': 200,
|
||||||
|
' mi': 201,
|
||||||
|
' mu': 202,
|
||||||
|
' ob': 203,
|
||||||
|
' pe': 204,
|
||||||
|
' pu': 205,
|
||||||
|
' so': 206,
|
||||||
|
'a i': 207,
|
||||||
|
'ale': 208,
|
||||||
|
'ca ': 209,
|
||||||
|
'cto': 210,
|
||||||
|
'e i': 211,
|
||||||
|
'e u': 212,
|
||||||
|
'eso': 213,
|
||||||
|
'fer': 214,
|
||||||
|
'fic': 215,
|
||||||
|
'gob': 216,
|
||||||
|
'jo ': 217,
|
||||||
|
'ma ': 218,
|
||||||
|
'mpl': 219,
|
||||||
|
'o p': 220,
|
||||||
|
'obi': 221,
|
||||||
|
's m': 222,
|
||||||
|
'sa ': 223,
|
||||||
|
'sep': 224,
|
||||||
|
'ste': 225,
|
||||||
|
'sti': 226,
|
||||||
|
'tad': 227,
|
||||||
|
'tod': 228,
|
||||||
|
'y s': 229,
|
||||||
|
' ci': 230,
|
||||||
|
'and': 231,
|
||||||
|
'ces': 232,
|
||||||
|
'có ': 233,
|
||||||
|
'dor': 234,
|
||||||
|
'e m': 235,
|
||||||
|
'eci': 236,
|
||||||
|
'eco': 237,
|
||||||
|
'esi': 238,
|
||||||
|
'int': 239,
|
||||||
|
'iza': 240,
|
||||||
|
'l e': 241,
|
||||||
|
'lar': 242,
|
||||||
|
'mie': 243,
|
||||||
|
'ner': 244,
|
||||||
|
'orc': 245,
|
||||||
|
'rci': 246,
|
||||||
|
'ria': 247,
|
||||||
|
'tic': 248,
|
||||||
|
'tor': 249,
|
||||||
|
' as': 250,
|
||||||
|
' si': 251,
|
||||||
|
'ce ': 252,
|
||||||
|
'den': 253,
|
||||||
|
'e r': 254,
|
||||||
|
'e t': 255,
|
||||||
|
'end': 256,
|
||||||
|
'eri': 257,
|
||||||
|
'esp': 258,
|
||||||
|
'ial': 259,
|
||||||
|
'ido': 260,
|
||||||
|
'ina': 261,
|
||||||
|
'inc': 262,
|
||||||
|
'mit': 263,
|
||||||
|
'o l': 264,
|
||||||
|
'ome': 265,
|
||||||
|
'pli': 266,
|
||||||
|
'ras': 267,
|
||||||
|
's t': 268,
|
||||||
|
'sid': 269,
|
||||||
|
'sup': 270,
|
||||||
|
'tab': 271,
|
||||||
|
'uen': 272,
|
||||||
|
'ues': 273,
|
||||||
|
'ura': 274,
|
||||||
|
'vo ': 275,
|
||||||
|
'vor': 276,
|
||||||
|
' sa': 277,
|
||||||
|
' ti': 278,
|
||||||
|
'abl': 279,
|
||||||
|
'ali': 280,
|
||||||
|
'aso': 281,
|
||||||
|
'ast': 282,
|
||||||
|
'cor': 283,
|
||||||
|
'cti': 284,
|
||||||
|
'cue': 285,
|
||||||
|
'div': 286,
|
||||||
|
'duc': 287,
|
||||||
|
'ens': 288,
|
||||||
|
'eti': 289,
|
||||||
|
'imi': 290,
|
||||||
|
'ini': 291,
|
||||||
|
'lec': 292,
|
||||||
|
'o q': 293,
|
||||||
|
'oce': 294,
|
||||||
|
'ort': 295,
|
||||||
|
'ral': 296,
|
||||||
|
'rma': 297,
|
||||||
|
'roc': 298,
|
||||||
|
'rod': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/et.py
Normal file
303
libs/guess_language/data/models/et.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'st ': 0,
|
||||||
|
' ka': 1,
|
||||||
|
'on ': 2,
|
||||||
|
'ja ': 3,
|
||||||
|
' va': 4,
|
||||||
|
' on': 5,
|
||||||
|
' ja': 6,
|
||||||
|
' ko': 7,
|
||||||
|
'se ': 8,
|
||||||
|
'ast': 9,
|
||||||
|
'le ': 10,
|
||||||
|
'es ': 11,
|
||||||
|
'as ': 12,
|
||||||
|
'is ': 13,
|
||||||
|
'ud ': 14,
|
||||||
|
' sa': 15,
|
||||||
|
'da ': 16,
|
||||||
|
'ga ': 17,
|
||||||
|
' ta': 18,
|
||||||
|
'aja': 19,
|
||||||
|
'sta': 20,
|
||||||
|
' ku': 21,
|
||||||
|
' pe': 22,
|
||||||
|
'a k': 23,
|
||||||
|
'est': 24,
|
||||||
|
'ist': 25,
|
||||||
|
'ks ': 26,
|
||||||
|
'ta ': 27,
|
||||||
|
'al ': 28,
|
||||||
|
'ava': 29,
|
||||||
|
'id ': 30,
|
||||||
|
'saa': 31,
|
||||||
|
'mis': 32,
|
||||||
|
'te ': 33,
|
||||||
|
'val': 34,
|
||||||
|
' et': 35,
|
||||||
|
'nud': 36,
|
||||||
|
' te': 37,
|
||||||
|
'inn': 38,
|
||||||
|
' se': 39,
|
||||||
|
' tu': 40,
|
||||||
|
'a v': 41,
|
||||||
|
'alu': 42,
|
||||||
|
'e k': 43,
|
||||||
|
'ise': 44,
|
||||||
|
'lu ': 45,
|
||||||
|
'ma ': 46,
|
||||||
|
'mes': 47,
|
||||||
|
' mi': 48,
|
||||||
|
'et ': 49,
|
||||||
|
'iku': 50,
|
||||||
|
'lin': 51,
|
||||||
|
'ad ': 52,
|
||||||
|
'el ': 53,
|
||||||
|
'ime': 54,
|
||||||
|
'ne ': 55,
|
||||||
|
'nna': 56,
|
||||||
|
' ha': 57,
|
||||||
|
' in': 58,
|
||||||
|
' ke': 59,
|
||||||
|
' võ': 60,
|
||||||
|
'a s': 61,
|
||||||
|
'a t': 62,
|
||||||
|
'ab ': 63,
|
||||||
|
'e s': 64,
|
||||||
|
'esi': 65,
|
||||||
|
' la': 66,
|
||||||
|
' li': 67,
|
||||||
|
'e v': 68,
|
||||||
|
'eks': 69,
|
||||||
|
'ema': 70,
|
||||||
|
'las': 71,
|
||||||
|
'les': 72,
|
||||||
|
'rju': 73,
|
||||||
|
'tle': 74,
|
||||||
|
'tsi': 75,
|
||||||
|
'tus': 76,
|
||||||
|
'upa': 77,
|
||||||
|
'use': 78,
|
||||||
|
'ust': 79,
|
||||||
|
'var': 80,
|
||||||
|
' lä': 81,
|
||||||
|
'ali': 82,
|
||||||
|
'arj': 83,
|
||||||
|
'de ': 84,
|
||||||
|
'ete': 85,
|
||||||
|
'i t': 86,
|
||||||
|
'iga': 87,
|
||||||
|
'ilm': 88,
|
||||||
|
'kui': 89,
|
||||||
|
'li ': 90,
|
||||||
|
'tul': 91,
|
||||||
|
' ei': 92,
|
||||||
|
' me': 93,
|
||||||
|
' sõ': 94,
|
||||||
|
'aal': 95,
|
||||||
|
'ata': 96,
|
||||||
|
'dus': 97,
|
||||||
|
'ei ': 98,
|
||||||
|
'nik': 99,
|
||||||
|
'pea': 100,
|
||||||
|
's k': 101,
|
||||||
|
's o': 102,
|
||||||
|
'sal': 103,
|
||||||
|
'sõn': 104,
|
||||||
|
'ter': 105,
|
||||||
|
'ul ': 106,
|
||||||
|
'või': 107,
|
||||||
|
' el': 108,
|
||||||
|
' ne': 109,
|
||||||
|
'a j': 110,
|
||||||
|
'ate': 111,
|
||||||
|
'end': 112,
|
||||||
|
'i k': 113,
|
||||||
|
'ita': 114,
|
||||||
|
'kar': 115,
|
||||||
|
'kor': 116,
|
||||||
|
'l o': 117,
|
||||||
|
'lt ': 118,
|
||||||
|
'maa': 119,
|
||||||
|
'oli': 120,
|
||||||
|
'sti': 121,
|
||||||
|
'vad': 122,
|
||||||
|
'ään': 123,
|
||||||
|
' ju': 124,
|
||||||
|
' jä': 125,
|
||||||
|
' kü': 126,
|
||||||
|
' ma': 127,
|
||||||
|
' po': 128,
|
||||||
|
' üt': 129,
|
||||||
|
'aas': 130,
|
||||||
|
'aks': 131,
|
||||||
|
'at ': 132,
|
||||||
|
'ed ': 133,
|
||||||
|
'eri': 134,
|
||||||
|
'hoi': 135,
|
||||||
|
'i s': 136,
|
||||||
|
'ka ': 137,
|
||||||
|
'la ': 138,
|
||||||
|
'nni': 139,
|
||||||
|
'oid': 140,
|
||||||
|
'pai': 141,
|
||||||
|
'rit': 142,
|
||||||
|
'us ': 143,
|
||||||
|
'ütl': 144,
|
||||||
|
' aa': 145,
|
||||||
|
' lo': 146,
|
||||||
|
' to': 147,
|
||||||
|
' ve': 148,
|
||||||
|
'a e': 149,
|
||||||
|
'ada': 150,
|
||||||
|
'aid': 151,
|
||||||
|
'ami': 152,
|
||||||
|
'and': 153,
|
||||||
|
'dla': 154,
|
||||||
|
'e j': 155,
|
||||||
|
'ega': 156,
|
||||||
|
'gi ': 157,
|
||||||
|
'gu ': 158,
|
||||||
|
'i p': 159,
|
||||||
|
'idl': 160,
|
||||||
|
'ik ': 161,
|
||||||
|
'ini': 162,
|
||||||
|
'jup': 163,
|
||||||
|
'kal': 164,
|
||||||
|
'kas': 165,
|
||||||
|
'kes': 166,
|
||||||
|
'koh': 167,
|
||||||
|
's e': 168,
|
||||||
|
's p': 169,
|
||||||
|
'sel': 170,
|
||||||
|
'sse': 171,
|
||||||
|
'ui ': 172,
|
||||||
|
' pi': 173,
|
||||||
|
' si': 174,
|
||||||
|
'aru': 175,
|
||||||
|
'eda': 176,
|
||||||
|
'eva': 177,
|
||||||
|
'fil': 178,
|
||||||
|
'i v': 179,
|
||||||
|
'ida': 180,
|
||||||
|
'ing': 181,
|
||||||
|
'lää': 182,
|
||||||
|
'me ': 183,
|
||||||
|
'na ': 184,
|
||||||
|
'nda': 185,
|
||||||
|
'nim': 186,
|
||||||
|
'ole': 187,
|
||||||
|
'ots': 188,
|
||||||
|
'ris': 189,
|
||||||
|
's l': 190,
|
||||||
|
'sia': 191,
|
||||||
|
't p': 192,
|
||||||
|
' en': 193,
|
||||||
|
' mu': 194,
|
||||||
|
' ol': 195,
|
||||||
|
' põ': 196,
|
||||||
|
' su': 197,
|
||||||
|
' vä': 198,
|
||||||
|
' üh': 199,
|
||||||
|
'a l': 200,
|
||||||
|
'a p': 201,
|
||||||
|
'aga': 202,
|
||||||
|
'ale': 203,
|
||||||
|
'aps': 204,
|
||||||
|
'arv': 205,
|
||||||
|
'e a': 206,
|
||||||
|
'ela': 207,
|
||||||
|
'ika': 208,
|
||||||
|
'lle': 209,
|
||||||
|
'loo': 210,
|
||||||
|
'mal': 211,
|
||||||
|
'pet': 212,
|
||||||
|
't k': 213,
|
||||||
|
'tee': 214,
|
||||||
|
'tis': 215,
|
||||||
|
'vat': 216,
|
||||||
|
'äne': 217,
|
||||||
|
'õnn': 218,
|
||||||
|
' es': 219,
|
||||||
|
' fi': 220,
|
||||||
|
' vi': 221,
|
||||||
|
'a i': 222,
|
||||||
|
'a o': 223,
|
||||||
|
'aab': 224,
|
||||||
|
'aap': 225,
|
||||||
|
'ala': 226,
|
||||||
|
'alt': 227,
|
||||||
|
'ama': 228,
|
||||||
|
'anu': 229,
|
||||||
|
'e p': 230,
|
||||||
|
'e t': 231,
|
||||||
|
'eal': 232,
|
||||||
|
'eli': 233,
|
||||||
|
'haa': 234,
|
||||||
|
'hin': 235,
|
||||||
|
'iva': 236,
|
||||||
|
'kon': 237,
|
||||||
|
'ku ': 238,
|
||||||
|
'lik': 239,
|
||||||
|
'lm ': 240,
|
||||||
|
'min': 241,
|
||||||
|
'n t': 242,
|
||||||
|
'odu': 243,
|
||||||
|
'oon': 244,
|
||||||
|
'psa': 245,
|
||||||
|
'ri ': 246,
|
||||||
|
'si ': 247,
|
||||||
|
'stu': 248,
|
||||||
|
't e': 249,
|
||||||
|
't s': 250,
|
||||||
|
'ti ': 251,
|
||||||
|
'ule': 252,
|
||||||
|
'uur': 253,
|
||||||
|
'vas': 254,
|
||||||
|
'vee': 255,
|
||||||
|
' ki': 256,
|
||||||
|
' ni': 257,
|
||||||
|
' nä': 258,
|
||||||
|
' ra': 259,
|
||||||
|
'aig': 260,
|
||||||
|
'aka': 261,
|
||||||
|
'all': 262,
|
||||||
|
'atu': 263,
|
||||||
|
'e e': 264,
|
||||||
|
'eis': 265,
|
||||||
|
'ers': 266,
|
||||||
|
'i e': 267,
|
||||||
|
'ii ': 268,
|
||||||
|
'iis': 269,
|
||||||
|
'il ': 270,
|
||||||
|
'ima': 271,
|
||||||
|
'its': 272,
|
||||||
|
'kka': 273,
|
||||||
|
'kuh': 274,
|
||||||
|
'l k': 275,
|
||||||
|
'lat': 276,
|
||||||
|
'maj': 277,
|
||||||
|
'ndu': 278,
|
||||||
|
'ni ': 279,
|
||||||
|
'nii': 280,
|
||||||
|
'oma': 281,
|
||||||
|
'ool': 282,
|
||||||
|
'rso': 283,
|
||||||
|
'ru ': 284,
|
||||||
|
'rva': 285,
|
||||||
|
's t': 286,
|
||||||
|
'sek': 287,
|
||||||
|
'son': 288,
|
||||||
|
'ste': 289,
|
||||||
|
't m': 290,
|
||||||
|
'taj': 291,
|
||||||
|
'tam': 292,
|
||||||
|
'ude': 293,
|
||||||
|
'uho': 294,
|
||||||
|
'vai': 295,
|
||||||
|
' ag': 296,
|
||||||
|
' os': 297,
|
||||||
|
' pa': 298,
|
||||||
|
' re': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/eu.py
Normal file
303
libs/guess_language/data/models/eu.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'en ': 0,
|
||||||
|
'an ': 1,
|
||||||
|
'eta': 2,
|
||||||
|
'ta ': 3,
|
||||||
|
' et': 4,
|
||||||
|
'iza': 5,
|
||||||
|
'n e': 6,
|
||||||
|
'ko ': 7,
|
||||||
|
'ide': 8,
|
||||||
|
' ba': 9,
|
||||||
|
'a e': 10,
|
||||||
|
'giz': 11,
|
||||||
|
' es': 12,
|
||||||
|
' gi': 13,
|
||||||
|
'arr': 14,
|
||||||
|
'bid': 15,
|
||||||
|
'ren': 16,
|
||||||
|
'rri': 17,
|
||||||
|
'are': 18,
|
||||||
|
'la ': 19,
|
||||||
|
'sku': 20,
|
||||||
|
' be': 21,
|
||||||
|
'asu': 22,
|
||||||
|
'esk': 23,
|
||||||
|
'sun': 24,
|
||||||
|
'tas': 25,
|
||||||
|
' iz': 26,
|
||||||
|
'ean': 27,
|
||||||
|
'eko': 28,
|
||||||
|
'ela': 29,
|
||||||
|
'ik ': 30,
|
||||||
|
'kub': 31,
|
||||||
|
'n a': 32,
|
||||||
|
'n i': 33,
|
||||||
|
'tza': 34,
|
||||||
|
'ubi': 35,
|
||||||
|
'za ': 36,
|
||||||
|
'zan': 37,
|
||||||
|
' er': 38,
|
||||||
|
'a b': 39,
|
||||||
|
'ask': 40,
|
||||||
|
'era': 41,
|
||||||
|
'n b': 42,
|
||||||
|
'rre': 43,
|
||||||
|
'ten': 44,
|
||||||
|
'tze': 45,
|
||||||
|
' as': 46,
|
||||||
|
' ko': 47,
|
||||||
|
'a a': 48,
|
||||||
|
'a g': 49,
|
||||||
|
'ald': 50,
|
||||||
|
'ani': 51,
|
||||||
|
'de ': 52,
|
||||||
|
'dee': 53,
|
||||||
|
'ea ': 54,
|
||||||
|
'ek ': 55,
|
||||||
|
'kat': 56,
|
||||||
|
'kon': 57,
|
||||||
|
'n d': 58,
|
||||||
|
'ont': 59,
|
||||||
|
'uan': 60,
|
||||||
|
' du': 61,
|
||||||
|
' na': 62,
|
||||||
|
'ata': 63,
|
||||||
|
'egi': 64,
|
||||||
|
'est': 65,
|
||||||
|
'k e': 66,
|
||||||
|
'nik': 67,
|
||||||
|
'ntu': 68,
|
||||||
|
'ntz': 69,
|
||||||
|
'ska': 70,
|
||||||
|
'tua': 71,
|
||||||
|
' de': 72,
|
||||||
|
' di': 73,
|
||||||
|
' ez': 74,
|
||||||
|
' he': 75,
|
||||||
|
'a d': 76,
|
||||||
|
'a k': 77,
|
||||||
|
'ak ': 78,
|
||||||
|
'aki': 79,
|
||||||
|
'ako': 80,
|
||||||
|
'art': 81,
|
||||||
|
'atu': 82,
|
||||||
|
'azi': 83,
|
||||||
|
'bat': 84,
|
||||||
|
'ber': 85,
|
||||||
|
'itz': 86,
|
||||||
|
'kun': 87,
|
||||||
|
'n h': 88,
|
||||||
|
'o b': 89,
|
||||||
|
'ria': 90,
|
||||||
|
'rte': 91,
|
||||||
|
'tat': 92,
|
||||||
|
'une': 93,
|
||||||
|
'zar': 94,
|
||||||
|
' al': 95,
|
||||||
|
' ar': 96,
|
||||||
|
' ha': 97,
|
||||||
|
'aku': 98,
|
||||||
|
'atz': 99,
|
||||||
|
'bai': 100,
|
||||||
|
'dar': 101,
|
||||||
|
'dea': 102,
|
||||||
|
'del': 103,
|
||||||
|
'een': 104,
|
||||||
|
'ema': 105,
|
||||||
|
'err': 106,
|
||||||
|
'iak': 107,
|
||||||
|
'iar': 108,
|
||||||
|
'in ': 109,
|
||||||
|
'ina': 110,
|
||||||
|
'kia': 111,
|
||||||
|
'nar': 112,
|
||||||
|
'naz': 113,
|
||||||
|
'nea': 114,
|
||||||
|
'o e': 115,
|
||||||
|
'orr': 116,
|
||||||
|
'ra ': 117,
|
||||||
|
'ste': 118,
|
||||||
|
'tek': 119,
|
||||||
|
'zak': 120,
|
||||||
|
'zek': 121,
|
||||||
|
'zio': 122,
|
||||||
|
' da': 123,
|
||||||
|
' em': 124,
|
||||||
|
' hi': 125,
|
||||||
|
' ho': 126,
|
||||||
|
' ma': 127,
|
||||||
|
' oi': 128,
|
||||||
|
'agu': 129,
|
||||||
|
'ate': 130,
|
||||||
|
'aur': 131,
|
||||||
|
'bes': 132,
|
||||||
|
'din': 133,
|
||||||
|
'dir': 134,
|
||||||
|
'dut': 135,
|
||||||
|
'ert': 136,
|
||||||
|
'ez ': 137,
|
||||||
|
'ezi': 138,
|
||||||
|
'har': 139,
|
||||||
|
'her': 140,
|
||||||
|
'hit': 141,
|
||||||
|
'ia ': 142,
|
||||||
|
'ien': 143,
|
||||||
|
'ika': 144,
|
||||||
|
'io ': 145,
|
||||||
|
'ire': 146,
|
||||||
|
'ite': 147,
|
||||||
|
'k b': 148,
|
||||||
|
'k g': 149,
|
||||||
|
'kid': 150,
|
||||||
|
'kor': 151,
|
||||||
|
'lda': 152,
|
||||||
|
'n o': 153,
|
||||||
|
'nko': 154,
|
||||||
|
'o a': 155,
|
||||||
|
'oin': 156,
|
||||||
|
'ori': 157,
|
||||||
|
'rak': 158,
|
||||||
|
'rea': 159,
|
||||||
|
'rie': 160,
|
||||||
|
'rik': 161,
|
||||||
|
'rra': 162,
|
||||||
|
'tan': 163,
|
||||||
|
'tea': 164,
|
||||||
|
'tu ': 165,
|
||||||
|
'una': 166,
|
||||||
|
'und': 167,
|
||||||
|
'unt': 168,
|
||||||
|
'urr': 169,
|
||||||
|
'ute': 170,
|
||||||
|
'z e': 171,
|
||||||
|
'zko': 172,
|
||||||
|
' au': 173,
|
||||||
|
' eg': 174,
|
||||||
|
' gu': 175,
|
||||||
|
' ir': 176,
|
||||||
|
' ki': 177,
|
||||||
|
' or': 178,
|
||||||
|
'a h': 179,
|
||||||
|
'a j': 180,
|
||||||
|
'abe': 181,
|
||||||
|
'agi': 182,
|
||||||
|
'ai ': 183,
|
||||||
|
'ail': 184,
|
||||||
|
'ait': 185,
|
||||||
|
'ape': 186,
|
||||||
|
'ari': 187,
|
||||||
|
'dez': 188,
|
||||||
|
'e e': 189,
|
||||||
|
'ear': 190,
|
||||||
|
'eek': 191,
|
||||||
|
'erd': 192,
|
||||||
|
'ere': 193,
|
||||||
|
'eza': 194,
|
||||||
|
'ezk': 195,
|
||||||
|
'gir': 196,
|
||||||
|
'git': 197,
|
||||||
|
'hor': 198,
|
||||||
|
'i e': 199,
|
||||||
|
'ian': 200,
|
||||||
|
'iek': 201,
|
||||||
|
'ila': 202,
|
||||||
|
'ink': 203,
|
||||||
|
'int': 204,
|
||||||
|
'ira': 205,
|
||||||
|
'ita': 206,
|
||||||
|
'itu': 207,
|
||||||
|
'k n': 208,
|
||||||
|
'kap': 209,
|
||||||
|
'koa': 210,
|
||||||
|
'kum': 211,
|
||||||
|
'lan': 212,
|
||||||
|
'lde': 213,
|
||||||
|
'mai': 214,
|
||||||
|
'man': 215,
|
||||||
|
'men': 216,
|
||||||
|
'n g': 217,
|
||||||
|
'n u': 218,
|
||||||
|
'na ': 219,
|
||||||
|
'nta': 220,
|
||||||
|
'o h': 221,
|
||||||
|
'oa ': 222,
|
||||||
|
'oro': 223,
|
||||||
|
'pen': 224,
|
||||||
|
'rdi': 225,
|
||||||
|
'ri ': 226,
|
||||||
|
'rta': 227,
|
||||||
|
'sta': 228,
|
||||||
|
'tel': 229,
|
||||||
|
'tet': 230,
|
||||||
|
'tik': 231,
|
||||||
|
'tue': 232,
|
||||||
|
'tzi': 233,
|
||||||
|
'ume': 234,
|
||||||
|
'un ': 235,
|
||||||
|
'uzt': 236,
|
||||||
|
'zea': 237,
|
||||||
|
'zen': 238,
|
||||||
|
'zia': 239,
|
||||||
|
'zin': 240,
|
||||||
|
' az': 241,
|
||||||
|
' bi': 242,
|
||||||
|
' bu': 243,
|
||||||
|
' el': 244,
|
||||||
|
' ga': 245,
|
||||||
|
' jo': 246,
|
||||||
|
' mu': 247,
|
||||||
|
' ti': 248,
|
||||||
|
' un': 249,
|
||||||
|
' za': 250,
|
||||||
|
' zi': 251,
|
||||||
|
'a n': 252,
|
||||||
|
'a o': 253,
|
||||||
|
'a s': 254,
|
||||||
|
'a t': 255,
|
||||||
|
'a z': 256,
|
||||||
|
'aba': 257,
|
||||||
|
'adi': 258,
|
||||||
|
'ake': 259,
|
||||||
|
'ala': 260,
|
||||||
|
'and': 261,
|
||||||
|
'ar ': 262,
|
||||||
|
'aud': 263,
|
||||||
|
'bak': 264,
|
||||||
|
'bal': 265,
|
||||||
|
'beg': 266,
|
||||||
|
'beh': 267,
|
||||||
|
'bul': 268,
|
||||||
|
'dau': 269,
|
||||||
|
'den': 270,
|
||||||
|
'du ': 271,
|
||||||
|
'dui': 272,
|
||||||
|
'e b': 273,
|
||||||
|
'e d': 274,
|
||||||
|
'e h': 275,
|
||||||
|
'e o': 276,
|
||||||
|
'eak': 277,
|
||||||
|
'eet': 278,
|
||||||
|
'eha': 279,
|
||||||
|
'elk': 280,
|
||||||
|
'enb': 281,
|
||||||
|
'ete': 282,
|
||||||
|
'eti': 283,
|
||||||
|
'gab': 284,
|
||||||
|
'gin': 285,
|
||||||
|
'go ': 286,
|
||||||
|
'gus': 287,
|
||||||
|
'gut': 288,
|
||||||
|
'guz': 289,
|
||||||
|
'hau': 290,
|
||||||
|
'ibe': 291,
|
||||||
|
'inb': 292,
|
||||||
|
'ine': 293,
|
||||||
|
'ioa': 294,
|
||||||
|
'iru': 295,
|
||||||
|
'iur': 296,
|
||||||
|
'izi': 297,
|
||||||
|
'izk': 298,
|
||||||
|
'izo': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/fa.py
Normal file
303
libs/guess_language/data/models/fa.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'ان ': 0,
|
||||||
|
'ای ': 1,
|
||||||
|
'ه ا': 2,
|
||||||
|
' اي': 3,
|
||||||
|
' در': 4,
|
||||||
|
'به ': 5,
|
||||||
|
' بر': 6,
|
||||||
|
'در ': 7,
|
||||||
|
'ران': 8,
|
||||||
|
' به': 9,
|
||||||
|
'ی ا': 10,
|
||||||
|
'از ': 11,
|
||||||
|
'ين ': 12,
|
||||||
|
'می ': 13,
|
||||||
|
' از': 14,
|
||||||
|
'ده ': 15,
|
||||||
|
'ست ': 16,
|
||||||
|
'است': 17,
|
||||||
|
' اس': 18,
|
||||||
|
' که': 19,
|
||||||
|
'که ': 20,
|
||||||
|
'اير': 21,
|
||||||
|
'ند ': 22,
|
||||||
|
'اين': 23,
|
||||||
|
' ها': 24,
|
||||||
|
'يرا': 25,
|
||||||
|
'ود ': 26,
|
||||||
|
' را': 27,
|
||||||
|
'های': 28,
|
||||||
|
' خو': 29,
|
||||||
|
'ته ': 30,
|
||||||
|
'را ': 31,
|
||||||
|
'رای': 32,
|
||||||
|
'رد ': 33,
|
||||||
|
'ن ب': 34,
|
||||||
|
'کرد': 35,
|
||||||
|
' و ': 36,
|
||||||
|
' کر': 37,
|
||||||
|
'ات ': 38,
|
||||||
|
'برا': 39,
|
||||||
|
'د ک': 40,
|
||||||
|
'مان': 41,
|
||||||
|
'ی د': 42,
|
||||||
|
' ان': 43,
|
||||||
|
'خوا': 44,
|
||||||
|
'شور': 45,
|
||||||
|
' با': 46,
|
||||||
|
'ن ا': 47,
|
||||||
|
' سا': 48,
|
||||||
|
'تمی': 49,
|
||||||
|
'ری ': 50,
|
||||||
|
'اتم': 51,
|
||||||
|
'ا ا': 52,
|
||||||
|
'واه': 53,
|
||||||
|
' ات': 54,
|
||||||
|
' عر': 55,
|
||||||
|
'اق ': 56,
|
||||||
|
'ر م': 57,
|
||||||
|
'راق': 58,
|
||||||
|
'عرا': 59,
|
||||||
|
'ی ب': 60,
|
||||||
|
' تا': 61,
|
||||||
|
' تو': 62,
|
||||||
|
'ار ': 63,
|
||||||
|
'ر ا': 64,
|
||||||
|
'ن م': 65,
|
||||||
|
'ه ب': 66,
|
||||||
|
'ور ': 67,
|
||||||
|
'يد ': 68,
|
||||||
|
'ی ک': 69,
|
||||||
|
' ام': 70,
|
||||||
|
' دا': 71,
|
||||||
|
' کن': 72,
|
||||||
|
'اهد': 73,
|
||||||
|
'هد ': 74,
|
||||||
|
' آن': 75,
|
||||||
|
' می': 76,
|
||||||
|
' ني': 77,
|
||||||
|
' گف': 78,
|
||||||
|
'د ا': 79,
|
||||||
|
'گفت': 80,
|
||||||
|
' کش': 81,
|
||||||
|
'ا ب': 82,
|
||||||
|
'نی ': 83,
|
||||||
|
'ها ': 84,
|
||||||
|
'کشو': 85,
|
||||||
|
' رو': 86,
|
||||||
|
'ت ک': 87,
|
||||||
|
'نيو': 88,
|
||||||
|
'ه م': 89,
|
||||||
|
'وی ': 90,
|
||||||
|
'ی ت': 91,
|
||||||
|
' شو': 92,
|
||||||
|
'ال ': 93,
|
||||||
|
'دار': 94,
|
||||||
|
'مه ': 95,
|
||||||
|
'ن ک': 96,
|
||||||
|
'ه د': 97,
|
||||||
|
'يه ': 98,
|
||||||
|
' ما': 99,
|
||||||
|
'امه': 100,
|
||||||
|
'د ب': 101,
|
||||||
|
'زار': 102,
|
||||||
|
'ورا': 103,
|
||||||
|
'گزا': 104,
|
||||||
|
' پي': 105,
|
||||||
|
'آن ': 106,
|
||||||
|
'انت': 107,
|
||||||
|
'ت ا': 108,
|
||||||
|
'فت ': 109,
|
||||||
|
'ه ن': 110,
|
||||||
|
'ی خ': 111,
|
||||||
|
'اما': 112,
|
||||||
|
'بات': 113,
|
||||||
|
'ما ': 114,
|
||||||
|
'ملل': 115,
|
||||||
|
'نام': 116,
|
||||||
|
'ير ': 117,
|
||||||
|
'ی م': 118,
|
||||||
|
'ی ه': 119,
|
||||||
|
' آم': 120,
|
||||||
|
' ای': 121,
|
||||||
|
' من': 122,
|
||||||
|
'انس': 123,
|
||||||
|
'اني': 124,
|
||||||
|
'ت د': 125,
|
||||||
|
'رده': 126,
|
||||||
|
'ساز': 127,
|
||||||
|
'ن د': 128,
|
||||||
|
'نه ': 129,
|
||||||
|
'ورد': 130,
|
||||||
|
' او': 131,
|
||||||
|
' بي': 132,
|
||||||
|
' سو': 133,
|
||||||
|
' شد': 134,
|
||||||
|
'اده': 135,
|
||||||
|
'اند': 136,
|
||||||
|
'با ': 137,
|
||||||
|
'ت ب': 138,
|
||||||
|
'ر ب': 139,
|
||||||
|
'ز ا': 140,
|
||||||
|
'زما': 141,
|
||||||
|
'سته': 142,
|
||||||
|
'ن ر': 143,
|
||||||
|
'ه س': 144,
|
||||||
|
'وان': 145,
|
||||||
|
'وز ': 146,
|
||||||
|
'ی ر': 147,
|
||||||
|
'ی س': 148,
|
||||||
|
' هس': 149,
|
||||||
|
'ابا': 150,
|
||||||
|
'ام ': 151,
|
||||||
|
'اور': 152,
|
||||||
|
'تخا': 153,
|
||||||
|
'خاب': 154,
|
||||||
|
'خود': 155,
|
||||||
|
'د د': 156,
|
||||||
|
'دن ': 157,
|
||||||
|
'رها': 158,
|
||||||
|
'روز': 159,
|
||||||
|
'رگز': 160,
|
||||||
|
'نتخ': 161,
|
||||||
|
'ه ش': 162,
|
||||||
|
'ه ه': 163,
|
||||||
|
'هست': 164,
|
||||||
|
'يت ': 165,
|
||||||
|
'يم ': 166,
|
||||||
|
' دو': 167,
|
||||||
|
' دي': 168,
|
||||||
|
' مو': 169,
|
||||||
|
' نو': 170,
|
||||||
|
' هم': 171,
|
||||||
|
' کا': 172,
|
||||||
|
'اد ': 173,
|
||||||
|
'اری': 174,
|
||||||
|
'انی': 175,
|
||||||
|
'بر ': 176,
|
||||||
|
'بود': 177,
|
||||||
|
'ت ه': 178,
|
||||||
|
'ح ه': 179,
|
||||||
|
'حال': 180,
|
||||||
|
'رش ': 181,
|
||||||
|
'عه ': 182,
|
||||||
|
'لی ': 183,
|
||||||
|
'وم ': 184,
|
||||||
|
'ژان': 185,
|
||||||
|
' سل': 186,
|
||||||
|
'آمر': 187,
|
||||||
|
'اح ': 188,
|
||||||
|
'توس': 189,
|
||||||
|
'داد': 190,
|
||||||
|
'دام': 191,
|
||||||
|
'ر د': 192,
|
||||||
|
'ره ': 193,
|
||||||
|
'ريک': 194,
|
||||||
|
'زی ': 195,
|
||||||
|
'سلا': 196,
|
||||||
|
'شود': 197,
|
||||||
|
'لاح': 198,
|
||||||
|
'مري': 199,
|
||||||
|
'نند': 200,
|
||||||
|
'ه ع': 201,
|
||||||
|
'يما': 202,
|
||||||
|
'يکا': 203,
|
||||||
|
'پيم': 204,
|
||||||
|
'گر ': 205,
|
||||||
|
' آژ': 206,
|
||||||
|
' ال': 207,
|
||||||
|
' بو': 208,
|
||||||
|
' مق': 209,
|
||||||
|
' مل': 210,
|
||||||
|
' وی': 211,
|
||||||
|
'آژا': 212,
|
||||||
|
'ازم': 213,
|
||||||
|
'ازی': 214,
|
||||||
|
'بار': 215,
|
||||||
|
'برن': 216,
|
||||||
|
'ر آ': 217,
|
||||||
|
'ز س': 218,
|
||||||
|
'سعه': 219,
|
||||||
|
'شته': 220,
|
||||||
|
'مات': 221,
|
||||||
|
'ن آ': 222,
|
||||||
|
'ن پ': 223,
|
||||||
|
'نس ': 224,
|
||||||
|
'ه گ': 225,
|
||||||
|
'وسع': 226,
|
||||||
|
'يان': 227,
|
||||||
|
'يوم': 228,
|
||||||
|
'کا ': 229,
|
||||||
|
'کام': 230,
|
||||||
|
'کند': 231,
|
||||||
|
' خا': 232,
|
||||||
|
' سر': 233,
|
||||||
|
'آور': 234,
|
||||||
|
'ارد': 235,
|
||||||
|
'اقد': 236,
|
||||||
|
'ايم': 237,
|
||||||
|
'ايی': 238,
|
||||||
|
'برگ': 239,
|
||||||
|
'ت ع': 240,
|
||||||
|
'تن ': 241,
|
||||||
|
'خت ': 242,
|
||||||
|
'د و': 243,
|
||||||
|
'ر خ': 244,
|
||||||
|
'رک ': 245,
|
||||||
|
'زير': 246,
|
||||||
|
'فته': 247,
|
||||||
|
'قدا': 248,
|
||||||
|
'ل ت': 249,
|
||||||
|
'مين': 250,
|
||||||
|
'ن گ': 251,
|
||||||
|
'ه آ': 252,
|
||||||
|
'ه خ': 253,
|
||||||
|
'ه ک': 254,
|
||||||
|
'ورک': 255,
|
||||||
|
'ويو': 256,
|
||||||
|
'يور': 257,
|
||||||
|
'يوي': 258,
|
||||||
|
'يی ': 259,
|
||||||
|
'ک ت': 260,
|
||||||
|
'ی ش': 261,
|
||||||
|
' اق': 262,
|
||||||
|
' حا': 263,
|
||||||
|
' حق': 264,
|
||||||
|
' دس': 265,
|
||||||
|
' شک': 266,
|
||||||
|
' عم': 267,
|
||||||
|
' يک': 268,
|
||||||
|
'ا ت': 269,
|
||||||
|
'ا د': 270,
|
||||||
|
'ارج': 271,
|
||||||
|
'بين': 272,
|
||||||
|
'ت م': 273,
|
||||||
|
'ت و': 274,
|
||||||
|
'تاي': 275,
|
||||||
|
'دست': 276,
|
||||||
|
'ر ح': 277,
|
||||||
|
'ر س': 278,
|
||||||
|
'رنا': 279,
|
||||||
|
'ز ب': 280,
|
||||||
|
'شکا': 281,
|
||||||
|
'لل ': 282,
|
||||||
|
'م ک': 283,
|
||||||
|
'مز ': 284,
|
||||||
|
'ندا': 285,
|
||||||
|
'نوا': 286,
|
||||||
|
'و ا': 287,
|
||||||
|
'وره': 288,
|
||||||
|
'ون ': 289,
|
||||||
|
'وند': 290,
|
||||||
|
'يمز': 291,
|
||||||
|
' آو': 292,
|
||||||
|
' اع': 293,
|
||||||
|
' فر': 294,
|
||||||
|
' مت': 295,
|
||||||
|
' نه': 296,
|
||||||
|
' هر': 297,
|
||||||
|
' وز': 298,
|
||||||
|
' گز': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/fi.py
Normal file
303
libs/guess_language/data/models/fi.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'en ': 0,
|
||||||
|
'in ': 1,
|
||||||
|
'an ': 2,
|
||||||
|
'on ': 3,
|
||||||
|
'ist': 4,
|
||||||
|
'ta ': 5,
|
||||||
|
'ja ': 6,
|
||||||
|
'n t': 7,
|
||||||
|
'sa ': 8,
|
||||||
|
'sta': 9,
|
||||||
|
'aan': 10,
|
||||||
|
'n p': 11,
|
||||||
|
' on': 12,
|
||||||
|
'ssa': 13,
|
||||||
|
'tta': 14,
|
||||||
|
'tä ': 15,
|
||||||
|
' ka': 16,
|
||||||
|
' pa': 17,
|
||||||
|
'si ': 18,
|
||||||
|
' ja': 19,
|
||||||
|
'n k': 20,
|
||||||
|
'lla': 21,
|
||||||
|
'än ': 22,
|
||||||
|
'een': 23,
|
||||||
|
'n v': 24,
|
||||||
|
'ksi': 25,
|
||||||
|
'ett': 26,
|
||||||
|
'nen': 27,
|
||||||
|
'taa': 28,
|
||||||
|
'ttä': 29,
|
||||||
|
' va': 30,
|
||||||
|
'ill': 31,
|
||||||
|
'itt': 32,
|
||||||
|
' jo': 33,
|
||||||
|
' ko': 34,
|
||||||
|
'n s': 35,
|
||||||
|
' tu': 36,
|
||||||
|
'ia ': 37,
|
||||||
|
' su': 38,
|
||||||
|
'a p': 39,
|
||||||
|
'aa ': 40,
|
||||||
|
'la ': 41,
|
||||||
|
'lle': 42,
|
||||||
|
'n m': 43,
|
||||||
|
'le ': 44,
|
||||||
|
'tte': 45,
|
||||||
|
'na ': 46,
|
||||||
|
' ta': 47,
|
||||||
|
' ve': 48,
|
||||||
|
'at ': 49,
|
||||||
|
' vi': 50,
|
||||||
|
'utt': 51,
|
||||||
|
' sa': 52,
|
||||||
|
'ise': 53,
|
||||||
|
'sen': 54,
|
||||||
|
' ku': 55,
|
||||||
|
' nä': 56,
|
||||||
|
' pä': 57,
|
||||||
|
'ste': 58,
|
||||||
|
' ol': 59,
|
||||||
|
'a t': 60,
|
||||||
|
'ais': 61,
|
||||||
|
'maa': 62,
|
||||||
|
'ti ': 63,
|
||||||
|
'a o': 64,
|
||||||
|
'oit': 65,
|
||||||
|
'pää': 66,
|
||||||
|
' pi': 67,
|
||||||
|
'a v': 68,
|
||||||
|
'ala': 69,
|
||||||
|
'ine': 70,
|
||||||
|
'isi': 71,
|
||||||
|
'tel': 72,
|
||||||
|
'tti': 73,
|
||||||
|
' si': 74,
|
||||||
|
'a k': 75,
|
||||||
|
'all': 76,
|
||||||
|
'iin': 77,
|
||||||
|
'kin': 78,
|
||||||
|
'stä': 79,
|
||||||
|
'uom': 80,
|
||||||
|
'vii': 81,
|
||||||
|
' ma': 82,
|
||||||
|
' se': 83,
|
||||||
|
'enä': 84,
|
||||||
|
' mu': 85,
|
||||||
|
'a s': 86,
|
||||||
|
'est': 87,
|
||||||
|
'iss': 88,
|
||||||
|
'llä': 89,
|
||||||
|
'lok': 90,
|
||||||
|
'lä ': 91,
|
||||||
|
'n j': 92,
|
||||||
|
'n o': 93,
|
||||||
|
'toi': 94,
|
||||||
|
'ven': 95,
|
||||||
|
'ytt': 96,
|
||||||
|
' li': 97,
|
||||||
|
'ain': 98,
|
||||||
|
'et ': 99,
|
||||||
|
'ina': 100,
|
||||||
|
'n a': 101,
|
||||||
|
'n n': 102,
|
||||||
|
'oll': 103,
|
||||||
|
'plo': 104,
|
||||||
|
'ten': 105,
|
||||||
|
'ust': 106,
|
||||||
|
'äll': 107,
|
||||||
|
'ään': 108,
|
||||||
|
' to': 109,
|
||||||
|
'den': 110,
|
||||||
|
'men': 111,
|
||||||
|
'oki': 112,
|
||||||
|
'suo': 113,
|
||||||
|
'sä ': 114,
|
||||||
|
'tää': 115,
|
||||||
|
'uks': 116,
|
||||||
|
'vat': 117,
|
||||||
|
' al': 118,
|
||||||
|
' ke': 119,
|
||||||
|
' te': 120,
|
||||||
|
'a e': 121,
|
||||||
|
'lii': 122,
|
||||||
|
'tai': 123,
|
||||||
|
'tei': 124,
|
||||||
|
'äis': 125,
|
||||||
|
'ää ': 126,
|
||||||
|
' pl': 127,
|
||||||
|
'ell': 128,
|
||||||
|
'i t': 129,
|
||||||
|
'ide': 130,
|
||||||
|
'ikk': 131,
|
||||||
|
'ki ': 132,
|
||||||
|
'nta': 133,
|
||||||
|
'ova': 134,
|
||||||
|
'yst': 135,
|
||||||
|
'yt ': 136,
|
||||||
|
'ä p': 137,
|
||||||
|
'äyt': 138,
|
||||||
|
' ha': 139,
|
||||||
|
' pe': 140,
|
||||||
|
' tä': 141,
|
||||||
|
'a n': 142,
|
||||||
|
'aik': 143,
|
||||||
|
'i p': 144,
|
||||||
|
'i v': 145,
|
||||||
|
'nyt': 146,
|
||||||
|
'näy': 147,
|
||||||
|
'pal': 148,
|
||||||
|
'tee': 149,
|
||||||
|
'un ': 150,
|
||||||
|
' me': 151,
|
||||||
|
'a m': 152,
|
||||||
|
'ess': 153,
|
||||||
|
'kau': 154,
|
||||||
|
'pai': 155,
|
||||||
|
'stu': 156,
|
||||||
|
'ut ': 157,
|
||||||
|
'voi': 158,
|
||||||
|
' et': 159,
|
||||||
|
'a h': 160,
|
||||||
|
'eis': 161,
|
||||||
|
'hte': 162,
|
||||||
|
'i o': 163,
|
||||||
|
'iik': 164,
|
||||||
|
'ita': 165,
|
||||||
|
'jou': 166,
|
||||||
|
'mis': 167,
|
||||||
|
'nin': 168,
|
||||||
|
'nut': 169,
|
||||||
|
'sia': 170,
|
||||||
|
'ssä': 171,
|
||||||
|
'van': 172,
|
||||||
|
' ty': 173,
|
||||||
|
' yh': 174,
|
||||||
|
'aks': 175,
|
||||||
|
'ime': 176,
|
||||||
|
'loi': 177,
|
||||||
|
'me ': 178,
|
||||||
|
'n e': 179,
|
||||||
|
'n h': 180,
|
||||||
|
'n l': 181,
|
||||||
|
'oin': 182,
|
||||||
|
'ome': 183,
|
||||||
|
'ott': 184,
|
||||||
|
'ouk': 185,
|
||||||
|
'sit': 186,
|
||||||
|
'sti': 187,
|
||||||
|
'tet': 188,
|
||||||
|
'tie': 189,
|
||||||
|
'ukk': 190,
|
||||||
|
'ä k': 191,
|
||||||
|
' ra': 192,
|
||||||
|
' ti': 193,
|
||||||
|
'aja': 194,
|
||||||
|
'asi': 195,
|
||||||
|
'ent': 196,
|
||||||
|
'iga': 197,
|
||||||
|
'iig': 198,
|
||||||
|
'ite': 199,
|
||||||
|
'jan': 200,
|
||||||
|
'kaa': 201,
|
||||||
|
'kse': 202,
|
||||||
|
'laa': 203,
|
||||||
|
'lan': 204,
|
||||||
|
'li ': 205,
|
||||||
|
'näj': 206,
|
||||||
|
'ole': 207,
|
||||||
|
'tii': 208,
|
||||||
|
'usi': 209,
|
||||||
|
'äjä': 210,
|
||||||
|
' ov': 211,
|
||||||
|
'a a': 212,
|
||||||
|
'ant': 213,
|
||||||
|
'ava': 214,
|
||||||
|
'ei ': 215,
|
||||||
|
'eri': 216,
|
||||||
|
'kan': 217,
|
||||||
|
'kku': 218,
|
||||||
|
'lai': 219,
|
||||||
|
'lis': 220,
|
||||||
|
'läi': 221,
|
||||||
|
'mat': 222,
|
||||||
|
'ois': 223,
|
||||||
|
'pel': 224,
|
||||||
|
'sil': 225,
|
||||||
|
'sty': 226,
|
||||||
|
'taj': 227,
|
||||||
|
'tav': 228,
|
||||||
|
'ttu': 229,
|
||||||
|
'työ': 230,
|
||||||
|
'yös': 231,
|
||||||
|
'ä o': 232,
|
||||||
|
' ai': 233,
|
||||||
|
' pu': 234,
|
||||||
|
'a j': 235,
|
||||||
|
'a l': 236,
|
||||||
|
'aal': 237,
|
||||||
|
'arv': 238,
|
||||||
|
'ass': 239,
|
||||||
|
'ien': 240,
|
||||||
|
'imi': 241,
|
||||||
|
'imm': 242,
|
||||||
|
'itä': 243,
|
||||||
|
'ka ': 244,
|
||||||
|
'kes': 245,
|
||||||
|
'kue': 246,
|
||||||
|
'lee': 247,
|
||||||
|
'lin': 248,
|
||||||
|
'llo': 249,
|
||||||
|
'one': 250,
|
||||||
|
'ri ': 251,
|
||||||
|
't o': 252,
|
||||||
|
't p': 253,
|
||||||
|
'tu ': 254,
|
||||||
|
'val': 255,
|
||||||
|
'vuo': 256,
|
||||||
|
' ei': 257,
|
||||||
|
' he': 258,
|
||||||
|
' hy': 259,
|
||||||
|
' my': 260,
|
||||||
|
' vo': 261,
|
||||||
|
'ali': 262,
|
||||||
|
'alo': 263,
|
||||||
|
'ano': 264,
|
||||||
|
'ast': 265,
|
||||||
|
'att': 266,
|
||||||
|
'auk': 267,
|
||||||
|
'eli': 268,
|
||||||
|
'ely': 269,
|
||||||
|
'hti': 270,
|
||||||
|
'ika': 271,
|
||||||
|
'ken': 272,
|
||||||
|
'kki': 273,
|
||||||
|
'lys': 274,
|
||||||
|
'min': 275,
|
||||||
|
'myö': 276,
|
||||||
|
'oht': 277,
|
||||||
|
'oma': 278,
|
||||||
|
'tus': 279,
|
||||||
|
'umi': 280,
|
||||||
|
'yks': 281,
|
||||||
|
'ät ': 282,
|
||||||
|
'ääl': 283,
|
||||||
|
'ös ': 284,
|
||||||
|
' ar': 285,
|
||||||
|
' eu': 286,
|
||||||
|
' hu': 287,
|
||||||
|
' na': 288,
|
||||||
|
'aat': 289,
|
||||||
|
'alk': 290,
|
||||||
|
'alu': 291,
|
||||||
|
'ans': 292,
|
||||||
|
'arj': 293,
|
||||||
|
'enn': 294,
|
||||||
|
'han': 295,
|
||||||
|
'kuu': 296,
|
||||||
|
'n y': 297,
|
||||||
|
'set': 298,
|
||||||
|
'sim': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/fr.py
Normal file
303
libs/guess_language/data/models/fr.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'es ': 0,
|
||||||
|
' de': 1,
|
||||||
|
'de ': 2,
|
||||||
|
' le': 3,
|
||||||
|
'ent': 4,
|
||||||
|
'le ': 5,
|
||||||
|
'nt ': 6,
|
||||||
|
'la ': 7,
|
||||||
|
's d': 8,
|
||||||
|
' la': 9,
|
||||||
|
'ion': 10,
|
||||||
|
'on ': 11,
|
||||||
|
're ': 12,
|
||||||
|
' pa': 13,
|
||||||
|
'e l': 14,
|
||||||
|
'e d': 15,
|
||||||
|
" l'": 16,
|
||||||
|
'e p': 17,
|
||||||
|
' co': 18,
|
||||||
|
' pr': 19,
|
||||||
|
'tio': 20,
|
||||||
|
'ns ': 21,
|
||||||
|
' en': 22,
|
||||||
|
'ne ': 23,
|
||||||
|
'que': 24,
|
||||||
|
'r l': 25,
|
||||||
|
'les': 26,
|
||||||
|
'ur ': 27,
|
||||||
|
'en ': 28,
|
||||||
|
'ati': 29,
|
||||||
|
'ue ': 30,
|
||||||
|
' po': 31,
|
||||||
|
" d'": 32,
|
||||||
|
'par': 33,
|
||||||
|
' a ': 34,
|
||||||
|
'et ': 35,
|
||||||
|
'it ': 36,
|
||||||
|
' qu': 37,
|
||||||
|
'men': 38,
|
||||||
|
'ons': 39,
|
||||||
|
'te ': 40,
|
||||||
|
' et': 41,
|
||||||
|
't d': 42,
|
||||||
|
' re': 43,
|
||||||
|
'des': 44,
|
||||||
|
' un': 45,
|
||||||
|
'ie ': 46,
|
||||||
|
's l': 47,
|
||||||
|
' su': 48,
|
||||||
|
'pou': 49,
|
||||||
|
' au': 50,
|
||||||
|
' à ': 51,
|
||||||
|
'con': 52,
|
||||||
|
'er ': 53,
|
||||||
|
' no': 54,
|
||||||
|
'ait': 55,
|
||||||
|
'e c': 56,
|
||||||
|
'se ': 57,
|
||||||
|
'té ': 58,
|
||||||
|
'du ': 59,
|
||||||
|
' du': 60,
|
||||||
|
' dé': 61,
|
||||||
|
'ce ': 62,
|
||||||
|
'e e': 63,
|
||||||
|
'is ': 64,
|
||||||
|
'n d': 65,
|
||||||
|
's a': 66,
|
||||||
|
' so': 67,
|
||||||
|
'e r': 68,
|
||||||
|
'e s': 69,
|
||||||
|
'our': 70,
|
||||||
|
'res': 71,
|
||||||
|
'ssi': 72,
|
||||||
|
'eur': 73,
|
||||||
|
' se': 74,
|
||||||
|
'eme': 75,
|
||||||
|
'est': 76,
|
||||||
|
'us ': 77,
|
||||||
|
'sur': 78,
|
||||||
|
'ant': 79,
|
||||||
|
'iqu': 80,
|
||||||
|
's p': 81,
|
||||||
|
'une': 82,
|
||||||
|
'uss': 83,
|
||||||
|
"l'a": 84,
|
||||||
|
'pro': 85,
|
||||||
|
'ter': 86,
|
||||||
|
'tre': 87,
|
||||||
|
'end': 88,
|
||||||
|
'rs ': 89,
|
||||||
|
' ce': 90,
|
||||||
|
'e a': 91,
|
||||||
|
't p': 92,
|
||||||
|
'un ': 93,
|
||||||
|
' ma': 94,
|
||||||
|
' ru': 95,
|
||||||
|
' ré': 96,
|
||||||
|
'ous': 97,
|
||||||
|
'ris': 98,
|
||||||
|
'rus': 99,
|
||||||
|
'sse': 100,
|
||||||
|
'ans': 101,
|
||||||
|
'ar ': 102,
|
||||||
|
'com': 103,
|
||||||
|
'e m': 104,
|
||||||
|
'ire': 105,
|
||||||
|
'nce': 106,
|
||||||
|
'nte': 107,
|
||||||
|
't l': 108,
|
||||||
|
' av': 109,
|
||||||
|
' mo': 110,
|
||||||
|
' te': 111,
|
||||||
|
'il ': 112,
|
||||||
|
'me ': 113,
|
||||||
|
'ont': 114,
|
||||||
|
'ten': 115,
|
||||||
|
'a p': 116,
|
||||||
|
'dan': 117,
|
||||||
|
'pas': 118,
|
||||||
|
'qui': 119,
|
||||||
|
's e': 120,
|
||||||
|
's s': 121,
|
||||||
|
' in': 122,
|
||||||
|
'ist': 123,
|
||||||
|
'lle': 124,
|
||||||
|
'nou': 125,
|
||||||
|
'pré': 126,
|
||||||
|
"'un": 127,
|
||||||
|
'air': 128,
|
||||||
|
"d'a": 129,
|
||||||
|
'ir ': 130,
|
||||||
|
'n e': 131,
|
||||||
|
'rop': 132,
|
||||||
|
'ts ': 133,
|
||||||
|
' da': 134,
|
||||||
|
'a s': 135,
|
||||||
|
'as ': 136,
|
||||||
|
'au ': 137,
|
||||||
|
'den': 138,
|
||||||
|
'mai': 139,
|
||||||
|
'mis': 140,
|
||||||
|
'ori': 141,
|
||||||
|
'out': 142,
|
||||||
|
'rme': 143,
|
||||||
|
'sio': 144,
|
||||||
|
'tte': 145,
|
||||||
|
'ux ': 146,
|
||||||
|
'a d': 147,
|
||||||
|
'ien': 148,
|
||||||
|
'n a': 149,
|
||||||
|
'ntr': 150,
|
||||||
|
'omm': 151,
|
||||||
|
'ort': 152,
|
||||||
|
'ouv': 153,
|
||||||
|
's c': 154,
|
||||||
|
'son': 155,
|
||||||
|
'tes': 156,
|
||||||
|
'ver': 157,
|
||||||
|
'ère': 158,
|
||||||
|
' il': 159,
|
||||||
|
' m ': 160,
|
||||||
|
' sa': 161,
|
||||||
|
' ve': 162,
|
||||||
|
'a r': 163,
|
||||||
|
'ais': 164,
|
||||||
|
'ava': 165,
|
||||||
|
'di ': 166,
|
||||||
|
'n p': 167,
|
||||||
|
'sti': 168,
|
||||||
|
'ven': 169,
|
||||||
|
' mi': 170,
|
||||||
|
'ain': 171,
|
||||||
|
'enc': 172,
|
||||||
|
'for': 173,
|
||||||
|
'ité': 174,
|
||||||
|
'lar': 175,
|
||||||
|
'oir': 176,
|
||||||
|
'rem': 177,
|
||||||
|
'ren': 178,
|
||||||
|
'rro': 179,
|
||||||
|
'rés': 180,
|
||||||
|
'sie': 181,
|
||||||
|
't a': 182,
|
||||||
|
'tur': 183,
|
||||||
|
' pe': 184,
|
||||||
|
' to': 185,
|
||||||
|
"d'u": 186,
|
||||||
|
'ell': 187,
|
||||||
|
'err': 188,
|
||||||
|
'ers': 189,
|
||||||
|
'ide': 190,
|
||||||
|
'ine': 191,
|
||||||
|
'iss': 192,
|
||||||
|
'mes': 193,
|
||||||
|
'por': 194,
|
||||||
|
'ran': 195,
|
||||||
|
'sit': 196,
|
||||||
|
'st ': 197,
|
||||||
|
't r': 198,
|
||||||
|
'uti': 199,
|
||||||
|
'vai': 200,
|
||||||
|
'é l': 201,
|
||||||
|
'ési': 202,
|
||||||
|
' di': 203,
|
||||||
|
" n'": 204,
|
||||||
|
' ét': 205,
|
||||||
|
'a c': 206,
|
||||||
|
'ass': 207,
|
||||||
|
'e t': 208,
|
||||||
|
'in ': 209,
|
||||||
|
'nde': 210,
|
||||||
|
'pre': 211,
|
||||||
|
'rat': 212,
|
||||||
|
's m': 213,
|
||||||
|
'ste': 214,
|
||||||
|
'tai': 215,
|
||||||
|
'tch': 216,
|
||||||
|
'ui ': 217,
|
||||||
|
'uro': 218,
|
||||||
|
'ès ': 219,
|
||||||
|
' es': 220,
|
||||||
|
' fo': 221,
|
||||||
|
' tr': 222,
|
||||||
|
"'ad": 223,
|
||||||
|
'app': 224,
|
||||||
|
'aux': 225,
|
||||||
|
'e à': 226,
|
||||||
|
'ett': 227,
|
||||||
|
'iti': 228,
|
||||||
|
'lit': 229,
|
||||||
|
'nal': 230,
|
||||||
|
'opé': 231,
|
||||||
|
'r d': 232,
|
||||||
|
'ra ': 233,
|
||||||
|
'rai': 234,
|
||||||
|
'ror': 235,
|
||||||
|
's r': 236,
|
||||||
|
'tat': 237,
|
||||||
|
'uté': 238,
|
||||||
|
'à l': 239,
|
||||||
|
' af': 240,
|
||||||
|
'anc': 241,
|
||||||
|
'ara': 242,
|
||||||
|
'art': 243,
|
||||||
|
'bre': 244,
|
||||||
|
'ché': 245,
|
||||||
|
'dre': 246,
|
||||||
|
'e f': 247,
|
||||||
|
'ens': 248,
|
||||||
|
'lem': 249,
|
||||||
|
'n r': 250,
|
||||||
|
'n t': 251,
|
||||||
|
'ndr': 252,
|
||||||
|
'nne': 253,
|
||||||
|
'onn': 254,
|
||||||
|
'pos': 255,
|
||||||
|
's t': 256,
|
||||||
|
'tiq': 257,
|
||||||
|
'ure': 258,
|
||||||
|
' tu': 259,
|
||||||
|
'ale': 260,
|
||||||
|
'and': 261,
|
||||||
|
'ave': 262,
|
||||||
|
'cla': 263,
|
||||||
|
'cou': 264,
|
||||||
|
'e n': 265,
|
||||||
|
'emb': 266,
|
||||||
|
'ins': 267,
|
||||||
|
'jou': 268,
|
||||||
|
'mme': 269,
|
||||||
|
'rie': 270,
|
||||||
|
'rès': 271,
|
||||||
|
'sem': 272,
|
||||||
|
'str': 273,
|
||||||
|
't i': 274,
|
||||||
|
'ues': 275,
|
||||||
|
'uni': 276,
|
||||||
|
'uve': 277,
|
||||||
|
'é d': 278,
|
||||||
|
'ée ': 279,
|
||||||
|
' ch': 280,
|
||||||
|
' do': 281,
|
||||||
|
' eu': 282,
|
||||||
|
' fa': 283,
|
||||||
|
' lo': 284,
|
||||||
|
' ne': 285,
|
||||||
|
' ra': 286,
|
||||||
|
'arl': 287,
|
||||||
|
'att': 288,
|
||||||
|
'ec ': 289,
|
||||||
|
'ica': 290,
|
||||||
|
'l a': 291,
|
||||||
|
"l'o": 292,
|
||||||
|
"l'é": 293,
|
||||||
|
'mmi': 294,
|
||||||
|
'nta': 295,
|
||||||
|
'orm': 296,
|
||||||
|
'ou ': 297,
|
||||||
|
'r u': 298,
|
||||||
|
'rle': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/ha.py
Normal file
303
libs/guess_language/data/models/ha.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
' da': 0,
|
||||||
|
'da ': 1,
|
||||||
|
'in ': 2,
|
||||||
|
'an ': 3,
|
||||||
|
'ya ': 4,
|
||||||
|
' wa': 5,
|
||||||
|
' ya': 6,
|
||||||
|
'na ': 7,
|
||||||
|
'ar ': 8,
|
||||||
|
'a d': 9,
|
||||||
|
' ma': 10,
|
||||||
|
'wa ': 11,
|
||||||
|
'a a': 12,
|
||||||
|
'a k': 13,
|
||||||
|
'a s': 14,
|
||||||
|
' ta': 15,
|
||||||
|
'wan': 16,
|
||||||
|
' a ': 17,
|
||||||
|
' ba': 18,
|
||||||
|
' ka': 19,
|
||||||
|
'ta ': 20,
|
||||||
|
'a y': 21,
|
||||||
|
'n d': 22,
|
||||||
|
' ha': 23,
|
||||||
|
' na': 24,
|
||||||
|
' su': 25,
|
||||||
|
' sa': 26,
|
||||||
|
'kin': 27,
|
||||||
|
'sa ': 28,
|
||||||
|
'ata': 29,
|
||||||
|
' ko': 30,
|
||||||
|
'a t': 31,
|
||||||
|
'su ': 32,
|
||||||
|
' ga': 33,
|
||||||
|
'ai ': 34,
|
||||||
|
' sh': 35,
|
||||||
|
'a m': 36,
|
||||||
|
'uwa': 37,
|
||||||
|
'iya': 38,
|
||||||
|
'ma ': 39,
|
||||||
|
'a w': 40,
|
||||||
|
'asa': 41,
|
||||||
|
'yan': 42,
|
||||||
|
'ka ': 43,
|
||||||
|
'ani': 44,
|
||||||
|
'shi': 45,
|
||||||
|
'a b': 46,
|
||||||
|
'a h': 47,
|
||||||
|
'a c': 48,
|
||||||
|
'ama': 49,
|
||||||
|
'ba ': 50,
|
||||||
|
'nan': 51,
|
||||||
|
'n a': 52,
|
||||||
|
' mu': 53,
|
||||||
|
'ana': 54,
|
||||||
|
' yi': 55,
|
||||||
|
'a g': 56,
|
||||||
|
' za': 57,
|
||||||
|
'i d': 58,
|
||||||
|
' ku': 59,
|
||||||
|
'aka': 60,
|
||||||
|
'yi ': 61,
|
||||||
|
'n k': 62,
|
||||||
|
'ann': 63,
|
||||||
|
'ke ': 64,
|
||||||
|
'tar': 65,
|
||||||
|
' ci': 66,
|
||||||
|
'iki': 67,
|
||||||
|
'n s': 68,
|
||||||
|
'ko ': 69,
|
||||||
|
' ra': 70,
|
||||||
|
'ki ': 71,
|
||||||
|
'ne ': 72,
|
||||||
|
'a z': 73,
|
||||||
|
'mat': 74,
|
||||||
|
'hak': 75,
|
||||||
|
'nin': 76,
|
||||||
|
'e d': 77,
|
||||||
|
'nna': 78,
|
||||||
|
'uma': 79,
|
||||||
|
'nda': 80,
|
||||||
|
'a n': 81,
|
||||||
|
'ada': 82,
|
||||||
|
'cik': 83,
|
||||||
|
'ni ': 84,
|
||||||
|
'rin': 85,
|
||||||
|
'una': 86,
|
||||||
|
'ara': 87,
|
||||||
|
'kum': 88,
|
||||||
|
'akk': 89,
|
||||||
|
' ce': 90,
|
||||||
|
' du': 91,
|
||||||
|
'man': 92,
|
||||||
|
'n y': 93,
|
||||||
|
'nci': 94,
|
||||||
|
'sar': 95,
|
||||||
|
'aki': 96,
|
||||||
|
'awa': 97,
|
||||||
|
'ci ': 98,
|
||||||
|
'kan': 99,
|
||||||
|
'kar': 100,
|
||||||
|
'ari': 101,
|
||||||
|
'n m': 102,
|
||||||
|
'and': 103,
|
||||||
|
'hi ': 104,
|
||||||
|
'n t': 105,
|
||||||
|
'ga ': 106,
|
||||||
|
'owa': 107,
|
||||||
|
'ash': 108,
|
||||||
|
'kam': 109,
|
||||||
|
'dan': 110,
|
||||||
|
'ewa': 111,
|
||||||
|
'nsa': 112,
|
||||||
|
'ali': 113,
|
||||||
|
'ami': 114,
|
||||||
|
' ab': 115,
|
||||||
|
' do': 116,
|
||||||
|
'anc': 117,
|
||||||
|
'n r': 118,
|
||||||
|
'aya': 119,
|
||||||
|
'i n': 120,
|
||||||
|
'sun': 121,
|
||||||
|
'uka': 122,
|
||||||
|
' al': 123,
|
||||||
|
' ne': 124,
|
||||||
|
"a'a": 125,
|
||||||
|
'cew': 126,
|
||||||
|
'cin': 127,
|
||||||
|
'mas': 128,
|
||||||
|
'tak': 129,
|
||||||
|
'un ': 130,
|
||||||
|
'aba': 131,
|
||||||
|
'kow': 132,
|
||||||
|
'a r': 133,
|
||||||
|
'ra ': 134,
|
||||||
|
' ja': 135,
|
||||||
|
' ƙa': 136,
|
||||||
|
'en ': 137,
|
||||||
|
'r d': 138,
|
||||||
|
'sam': 139,
|
||||||
|
'tsa': 140,
|
||||||
|
' ru': 141,
|
||||||
|
'ce ': 142,
|
||||||
|
'i a': 143,
|
||||||
|
'abi': 144,
|
||||||
|
'ida': 145,
|
||||||
|
'mut': 146,
|
||||||
|
'n g': 147,
|
||||||
|
'n j': 148,
|
||||||
|
'san': 149,
|
||||||
|
'a ƙ': 150,
|
||||||
|
'har': 151,
|
||||||
|
'on ': 152,
|
||||||
|
'i m': 153,
|
||||||
|
'suk': 154,
|
||||||
|
' ak': 155,
|
||||||
|
' ji': 156,
|
||||||
|
'yar': 157,
|
||||||
|
"'ya": 158,
|
||||||
|
'kwa': 159,
|
||||||
|
'min': 160,
|
||||||
|
" 'y": 161,
|
||||||
|
'ane': 162,
|
||||||
|
'ban': 163,
|
||||||
|
'ins': 164,
|
||||||
|
'ruw': 165,
|
||||||
|
'i k': 166,
|
||||||
|
'n h': 167,
|
||||||
|
' ad': 168,
|
||||||
|
'ake': 169,
|
||||||
|
'n w': 170,
|
||||||
|
'sha': 171,
|
||||||
|
'utu': 172,
|
||||||
|
' ƴa': 173,
|
||||||
|
'bay': 174,
|
||||||
|
'tan': 175,
|
||||||
|
'ƴan': 176,
|
||||||
|
'bin': 177,
|
||||||
|
'duk': 178,
|
||||||
|
'e m': 179,
|
||||||
|
'n n': 180,
|
||||||
|
'oka': 181,
|
||||||
|
'yin': 182,
|
||||||
|
'ɗan': 183,
|
||||||
|
' fa': 184,
|
||||||
|
'a i': 185,
|
||||||
|
'kki': 186,
|
||||||
|
're ': 187,
|
||||||
|
'za ': 188,
|
||||||
|
'ala': 189,
|
||||||
|
'asu': 190,
|
||||||
|
'han': 191,
|
||||||
|
'i y': 192,
|
||||||
|
'mar': 193,
|
||||||
|
'ran': 194,
|
||||||
|
'ƙas': 195,
|
||||||
|
'add': 196,
|
||||||
|
'ars': 197,
|
||||||
|
'gab': 198,
|
||||||
|
'ira': 199,
|
||||||
|
'mma': 200,
|
||||||
|
'u d': 201,
|
||||||
|
' ts': 202,
|
||||||
|
'abb': 203,
|
||||||
|
'abu': 204,
|
||||||
|
'aga': 205,
|
||||||
|
'gar': 206,
|
||||||
|
'n b': 207,
|
||||||
|
' ɗa': 208,
|
||||||
|
'aci': 209,
|
||||||
|
'aik': 210,
|
||||||
|
'am ': 211,
|
||||||
|
'dun': 212,
|
||||||
|
'e s': 213,
|
||||||
|
'i b': 214,
|
||||||
|
'i w': 215,
|
||||||
|
'kas': 216,
|
||||||
|
'kok': 217,
|
||||||
|
'wam': 218,
|
||||||
|
' am': 219,
|
||||||
|
'amf': 220,
|
||||||
|
'bba': 221,
|
||||||
|
'din': 222,
|
||||||
|
'fan': 223,
|
||||||
|
'gwa': 224,
|
||||||
|
'i s': 225,
|
||||||
|
'wat': 226,
|
||||||
|
'ano': 227,
|
||||||
|
'are': 228,
|
||||||
|
'dai': 229,
|
||||||
|
'iri': 230,
|
||||||
|
"ma'": 231,
|
||||||
|
' la': 232,
|
||||||
|
'all': 233,
|
||||||
|
'dam': 234,
|
||||||
|
'ika': 235,
|
||||||
|
'mi ': 236,
|
||||||
|
'she': 237,
|
||||||
|
'tum': 238,
|
||||||
|
'uni': 239,
|
||||||
|
' an': 240,
|
||||||
|
' ai': 241,
|
||||||
|
' ke': 242,
|
||||||
|
' ki': 243,
|
||||||
|
'dag': 244,
|
||||||
|
'mai': 245,
|
||||||
|
'mfa': 246,
|
||||||
|
'no ': 247,
|
||||||
|
'nsu': 248,
|
||||||
|
'o d': 249,
|
||||||
|
'sak': 250,
|
||||||
|
'um ': 251,
|
||||||
|
' bi': 252,
|
||||||
|
' gw': 253,
|
||||||
|
' kw': 254,
|
||||||
|
'jam': 255,
|
||||||
|
'yya': 256,
|
||||||
|
'a j': 257,
|
||||||
|
'fa ': 258,
|
||||||
|
'uta': 259,
|
||||||
|
' hu': 260,
|
||||||
|
"'a ": 261,
|
||||||
|
'ans': 262,
|
||||||
|
'aɗa': 263,
|
||||||
|
'dda': 264,
|
||||||
|
'hin': 265,
|
||||||
|
'niy': 266,
|
||||||
|
'r s': 267,
|
||||||
|
'bat': 268,
|
||||||
|
'dar': 269,
|
||||||
|
'gan': 270,
|
||||||
|
'i t': 271,
|
||||||
|
'nta': 272,
|
||||||
|
'oki': 273,
|
||||||
|
'omi': 274,
|
||||||
|
'sal': 275,
|
||||||
|
'a l': 276,
|
||||||
|
'kac': 277,
|
||||||
|
'lla': 278,
|
||||||
|
'wad': 279,
|
||||||
|
'war': 280,
|
||||||
|
'amm': 281,
|
||||||
|
'dom': 282,
|
||||||
|
'r m': 283,
|
||||||
|
'ras': 284,
|
||||||
|
'sai': 285,
|
||||||
|
' lo': 286,
|
||||||
|
'ats': 287,
|
||||||
|
'hal': 288,
|
||||||
|
'kat': 289,
|
||||||
|
'li ': 290,
|
||||||
|
'lok': 291,
|
||||||
|
'n c': 292,
|
||||||
|
'nar': 293,
|
||||||
|
'tin': 294,
|
||||||
|
'afa': 295,
|
||||||
|
'bub': 296,
|
||||||
|
'i g': 297,
|
||||||
|
'isa': 298,
|
||||||
|
'mak': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/haw.py
Normal file
303
libs/guess_language/data/models/haw.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
' ka': 0,
|
||||||
|
'na ': 1,
|
||||||
|
' o ': 2,
|
||||||
|
'ka ': 3,
|
||||||
|
' ma': 4,
|
||||||
|
' a ': 5,
|
||||||
|
' la': 6,
|
||||||
|
'a i': 7,
|
||||||
|
'a m': 8,
|
||||||
|
' i ': 9,
|
||||||
|
'la ': 10,
|
||||||
|
'ana': 11,
|
||||||
|
'ai ': 12,
|
||||||
|
'ia ': 13,
|
||||||
|
'a o': 14,
|
||||||
|
'a k': 15,
|
||||||
|
'a h': 16,
|
||||||
|
'o k': 17,
|
||||||
|
' ke': 18,
|
||||||
|
'a a': 19,
|
||||||
|
'i k': 20,
|
||||||
|
' ho': 21,
|
||||||
|
' ia': 22,
|
||||||
|
'ua ': 23,
|
||||||
|
' na': 24,
|
||||||
|
' me': 25,
|
||||||
|
'e k': 26,
|
||||||
|
'e a': 27,
|
||||||
|
'au ': 28,
|
||||||
|
'ke ': 29,
|
||||||
|
'ma ': 30,
|
||||||
|
'mai': 31,
|
||||||
|
'aku': 32,
|
||||||
|
' ak': 33,
|
||||||
|
'ahi': 34,
|
||||||
|
' ha': 35,
|
||||||
|
' ko': 36,
|
||||||
|
' e ': 37,
|
||||||
|
'a l': 38,
|
||||||
|
' no': 39,
|
||||||
|
'me ': 40,
|
||||||
|
'ku ': 41,
|
||||||
|
'aka': 42,
|
||||||
|
'kan': 43,
|
||||||
|
'no ': 44,
|
||||||
|
'i a': 45,
|
||||||
|
'ho ': 46,
|
||||||
|
'ou ': 47,
|
||||||
|
' ai': 48,
|
||||||
|
'i o': 49,
|
||||||
|
'a p': 50,
|
||||||
|
'o l': 51,
|
||||||
|
'o a': 52,
|
||||||
|
'ama': 53,
|
||||||
|
'a n': 54,
|
||||||
|
' an': 55,
|
||||||
|
'i m': 56,
|
||||||
|
'han': 57,
|
||||||
|
'i i': 58,
|
||||||
|
'iho': 59,
|
||||||
|
'kou': 60,
|
||||||
|
'ne ': 61,
|
||||||
|
' ih': 62,
|
||||||
|
'o i': 63,
|
||||||
|
'iki': 64,
|
||||||
|
'ona': 65,
|
||||||
|
'hoo': 66,
|
||||||
|
'le ': 67,
|
||||||
|
'e h': 68,
|
||||||
|
' he': 69,
|
||||||
|
'ina': 70,
|
||||||
|
' wa': 71,
|
||||||
|
'ea ': 72,
|
||||||
|
'ako': 73,
|
||||||
|
'u i': 74,
|
||||||
|
'kah': 75,
|
||||||
|
'oe ': 76,
|
||||||
|
'i l': 77,
|
||||||
|
'u a': 78,
|
||||||
|
' pa': 79,
|
||||||
|
'hoi': 80,
|
||||||
|
'e i': 81,
|
||||||
|
'era': 82,
|
||||||
|
'ko ': 83,
|
||||||
|
'u m': 84,
|
||||||
|
'kua': 85,
|
||||||
|
'mak': 86,
|
||||||
|
'oi ': 87,
|
||||||
|
'kai': 88,
|
||||||
|
'i n': 89,
|
||||||
|
'a e': 90,
|
||||||
|
'hin': 91,
|
||||||
|
'ane': 92,
|
||||||
|
' ol': 93,
|
||||||
|
'i h': 94,
|
||||||
|
'mea': 95,
|
||||||
|
'wah': 96,
|
||||||
|
'lak': 97,
|
||||||
|
'e m': 98,
|
||||||
|
'o n': 99,
|
||||||
|
'u l': 100,
|
||||||
|
'ika': 101,
|
||||||
|
'ki ': 102,
|
||||||
|
'a w': 103,
|
||||||
|
'mal': 104,
|
||||||
|
'hi ': 105,
|
||||||
|
'e n': 106,
|
||||||
|
'u o': 107,
|
||||||
|
'hik': 108,
|
||||||
|
' ku': 109,
|
||||||
|
'e l': 110,
|
||||||
|
'ele': 111,
|
||||||
|
'ra ': 112,
|
||||||
|
'ber': 113,
|
||||||
|
'ine': 114,
|
||||||
|
'abe': 115,
|
||||||
|
'ain': 116,
|
||||||
|
'ala': 117,
|
||||||
|
'lo ': 118,
|
||||||
|
' po': 119,
|
||||||
|
'kon': 120,
|
||||||
|
' ab': 121,
|
||||||
|
'ole': 122,
|
||||||
|
'he ': 123,
|
||||||
|
'pau': 124,
|
||||||
|
'mah': 125,
|
||||||
|
'va ': 126,
|
||||||
|
'ela': 127,
|
||||||
|
'kau': 128,
|
||||||
|
'nak': 129,
|
||||||
|
' oe': 130,
|
||||||
|
'kei': 131,
|
||||||
|
'oia': 132,
|
||||||
|
' ie': 133,
|
||||||
|
'ram': 134,
|
||||||
|
' oi': 135,
|
||||||
|
'oa ': 136,
|
||||||
|
'eho': 137,
|
||||||
|
'hov': 138,
|
||||||
|
'ieh': 139,
|
||||||
|
'ova': 140,
|
||||||
|
' ua': 141,
|
||||||
|
'una': 142,
|
||||||
|
'ara': 143,
|
||||||
|
'o s': 144,
|
||||||
|
'awa': 145,
|
||||||
|
'o o': 146,
|
||||||
|
'nau': 147,
|
||||||
|
'u n': 148,
|
||||||
|
'wa ': 149,
|
||||||
|
'wai': 150,
|
||||||
|
'hel': 151,
|
||||||
|
' ae': 152,
|
||||||
|
' al': 153,
|
||||||
|
'ae ': 154,
|
||||||
|
'ta ': 155,
|
||||||
|
'aik': 156,
|
||||||
|
' hi': 157,
|
||||||
|
'ale': 158,
|
||||||
|
'ila': 159,
|
||||||
|
'lel': 160,
|
||||||
|
'ali': 161,
|
||||||
|
'eik': 162,
|
||||||
|
'olo': 163,
|
||||||
|
'onu': 164,
|
||||||
|
' lo': 165,
|
||||||
|
'aua': 166,
|
||||||
|
'e o': 167,
|
||||||
|
'ola': 168,
|
||||||
|
'hon': 169,
|
||||||
|
'mam': 170,
|
||||||
|
'nan': 171,
|
||||||
|
' au': 172,
|
||||||
|
'aha': 173,
|
||||||
|
'lau': 174,
|
||||||
|
'nua': 175,
|
||||||
|
'oho': 176,
|
||||||
|
'oma': 177,
|
||||||
|
' ao': 178,
|
||||||
|
'ii ': 179,
|
||||||
|
'alu': 180,
|
||||||
|
'ima': 181,
|
||||||
|
'mau': 182,
|
||||||
|
'ike': 183,
|
||||||
|
'apa': 184,
|
||||||
|
'elo': 185,
|
||||||
|
'lii': 186,
|
||||||
|
'poe': 187,
|
||||||
|
'aia': 188,
|
||||||
|
'noa': 189,
|
||||||
|
' in': 190,
|
||||||
|
'o m': 191,
|
||||||
|
'oka': 192,
|
||||||
|
"'u ": 193,
|
||||||
|
'aho': 194,
|
||||||
|
'ei ': 195,
|
||||||
|
'eka': 196,
|
||||||
|
'ha ': 197,
|
||||||
|
'lu ': 198,
|
||||||
|
'nei': 199,
|
||||||
|
'hol': 200,
|
||||||
|
'ino': 201,
|
||||||
|
'o e': 202,
|
||||||
|
'ema': 203,
|
||||||
|
'iwa': 204,
|
||||||
|
'olu': 205,
|
||||||
|
'ada': 206,
|
||||||
|
'naa': 207,
|
||||||
|
'pa ': 208,
|
||||||
|
'u k': 209,
|
||||||
|
'ewa': 210,
|
||||||
|
'hua': 211,
|
||||||
|
'lam': 212,
|
||||||
|
'lua': 213,
|
||||||
|
'o h': 214,
|
||||||
|
'ook': 215,
|
||||||
|
'u h': 216,
|
||||||
|
' li': 217,
|
||||||
|
'ahu': 218,
|
||||||
|
'amu': 219,
|
||||||
|
'ui ': 220,
|
||||||
|
' il': 221,
|
||||||
|
' mo': 222,
|
||||||
|
' se': 223,
|
||||||
|
'eia': 224,
|
||||||
|
'law': 225,
|
||||||
|
' hu': 226,
|
||||||
|
' ik': 227,
|
||||||
|
'ail': 228,
|
||||||
|
'e p': 229,
|
||||||
|
'li ': 230,
|
||||||
|
'lun': 231,
|
||||||
|
'uli': 232,
|
||||||
|
'io ': 233,
|
||||||
|
'kik': 234,
|
||||||
|
'noh': 235,
|
||||||
|
'u e': 236,
|
||||||
|
' sa': 237,
|
||||||
|
'aaw': 238,
|
||||||
|
'awe': 239,
|
||||||
|
'ena': 240,
|
||||||
|
'hal': 241,
|
||||||
|
'kol': 242,
|
||||||
|
'lan': 243,
|
||||||
|
' le': 244,
|
||||||
|
' ne': 245,
|
||||||
|
"a'u": 246,
|
||||||
|
'ilo': 247,
|
||||||
|
'kap': 248,
|
||||||
|
'oko': 249,
|
||||||
|
'sa ': 250,
|
||||||
|
' pe': 251,
|
||||||
|
'hop': 252,
|
||||||
|
'loa': 253,
|
||||||
|
'ope': 254,
|
||||||
|
'pe ': 255,
|
||||||
|
' ad': 256,
|
||||||
|
' pu': 257,
|
||||||
|
'ahe': 258,
|
||||||
|
'aol': 259,
|
||||||
|
"ia'": 260,
|
||||||
|
'lai': 261,
|
||||||
|
'loh': 262,
|
||||||
|
"na'": 263,
|
||||||
|
'oom': 264,
|
||||||
|
'aau': 265,
|
||||||
|
'eri': 266,
|
||||||
|
'kul': 267,
|
||||||
|
'we ': 268,
|
||||||
|
'ake': 269,
|
||||||
|
'kek': 270,
|
||||||
|
'laa': 271,
|
||||||
|
'ri ': 272,
|
||||||
|
'iku': 273,
|
||||||
|
'kak': 274,
|
||||||
|
'lim': 275,
|
||||||
|
'nah': 276,
|
||||||
|
'ner': 277,
|
||||||
|
'nui': 278,
|
||||||
|
'ono': 279,
|
||||||
|
'a u': 280,
|
||||||
|
'dam': 281,
|
||||||
|
'kum': 282,
|
||||||
|
'lok': 283,
|
||||||
|
'mua': 284,
|
||||||
|
'uma': 285,
|
||||||
|
'wal': 286,
|
||||||
|
'wi ': 287,
|
||||||
|
"'i ": 288,
|
||||||
|
"a'i": 289,
|
||||||
|
'aan': 290,
|
||||||
|
'alo': 291,
|
||||||
|
'eta': 292,
|
||||||
|
'mu ': 293,
|
||||||
|
'ohe': 294,
|
||||||
|
'u p': 295,
|
||||||
|
'ula': 296,
|
||||||
|
'uwa': 297,
|
||||||
|
' nu': 298,
|
||||||
|
'amo': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/hi.py
Normal file
303
libs/guess_language/data/models/hi.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'ें ': 0,
|
||||||
|
' है': 1,
|
||||||
|
'में': 2,
|
||||||
|
' मे': 3,
|
||||||
|
'ने ': 4,
|
||||||
|
'की ': 5,
|
||||||
|
'के ': 6,
|
||||||
|
'है ': 7,
|
||||||
|
' के': 8,
|
||||||
|
' की': 9,
|
||||||
|
' को': 10,
|
||||||
|
'ों ': 11,
|
||||||
|
'को ': 12,
|
||||||
|
'ा ह': 13,
|
||||||
|
' का': 14,
|
||||||
|
'से ': 15,
|
||||||
|
'ा क': 16,
|
||||||
|
'े क': 17,
|
||||||
|
'ं क': 18,
|
||||||
|
'या ': 19,
|
||||||
|
' कि': 20,
|
||||||
|
' से': 21,
|
||||||
|
'का ': 22,
|
||||||
|
'ी क': 23,
|
||||||
|
' ने': 24,
|
||||||
|
' और': 25,
|
||||||
|
'और ': 26,
|
||||||
|
'ना ': 27,
|
||||||
|
'कि ': 28,
|
||||||
|
'भी ': 29,
|
||||||
|
'ी स': 30,
|
||||||
|
' जा': 31,
|
||||||
|
' पर': 32,
|
||||||
|
'ार ': 33,
|
||||||
|
' कर': 34,
|
||||||
|
'ी ह': 35,
|
||||||
|
' हो': 36,
|
||||||
|
'ही ': 37,
|
||||||
|
'िया': 38,
|
||||||
|
' इस': 39,
|
||||||
|
' रह': 40,
|
||||||
|
'र क': 41,
|
||||||
|
'ुना': 42,
|
||||||
|
'ता ': 43,
|
||||||
|
'ान ': 44,
|
||||||
|
'े स': 45,
|
||||||
|
' भी': 46,
|
||||||
|
' रा': 47,
|
||||||
|
'े ह': 48,
|
||||||
|
' चु': 49,
|
||||||
|
' पा': 50,
|
||||||
|
'पर ': 51,
|
||||||
|
'चुन': 52,
|
||||||
|
'नाव': 53,
|
||||||
|
' कह': 54,
|
||||||
|
'प्र': 55,
|
||||||
|
' भा': 56,
|
||||||
|
'राज': 57,
|
||||||
|
'हैं': 58,
|
||||||
|
'ा स': 59,
|
||||||
|
'ै क': 60,
|
||||||
|
'ैं ': 61,
|
||||||
|
'नी ': 62,
|
||||||
|
'ल क': 63,
|
||||||
|
'ीं ': 64,
|
||||||
|
'़ी ': 65,
|
||||||
|
'था ': 66,
|
||||||
|
'री ': 67,
|
||||||
|
'ाव ': 68,
|
||||||
|
'े ब': 69,
|
||||||
|
' प्': 70,
|
||||||
|
'क्ष': 71,
|
||||||
|
'पा ': 72,
|
||||||
|
'ले ': 73,
|
||||||
|
' दे': 74,
|
||||||
|
'ला ': 75,
|
||||||
|
'हा ': 76,
|
||||||
|
'ाजप': 77,
|
||||||
|
' था': 78,
|
||||||
|
' नह': 79,
|
||||||
|
'इस ': 80,
|
||||||
|
'कर ': 81,
|
||||||
|
'जपा': 82,
|
||||||
|
'नही': 83,
|
||||||
|
'भाज': 84,
|
||||||
|
'यों': 85,
|
||||||
|
'र स': 86,
|
||||||
|
'हीं': 87,
|
||||||
|
' अम': 88,
|
||||||
|
' बा': 89,
|
||||||
|
' मा': 90,
|
||||||
|
' वि': 91,
|
||||||
|
'रीक': 92,
|
||||||
|
'िए ': 93,
|
||||||
|
'े प': 94,
|
||||||
|
'्या': 95,
|
||||||
|
' ही': 96,
|
||||||
|
'ं म': 97,
|
||||||
|
'कार': 98,
|
||||||
|
'ा ज': 99,
|
||||||
|
'े ल': 100,
|
||||||
|
' ता': 101,
|
||||||
|
' दि': 102,
|
||||||
|
' सा': 103,
|
||||||
|
' हम': 104,
|
||||||
|
'ा न': 105,
|
||||||
|
'ा म': 106,
|
||||||
|
'ाक़': 107,
|
||||||
|
'्ता': 108,
|
||||||
|
' एक': 109,
|
||||||
|
' सं': 110,
|
||||||
|
' स्': 111,
|
||||||
|
'अमर': 112,
|
||||||
|
'क़ी': 113,
|
||||||
|
'ताज': 114,
|
||||||
|
'मरी': 115,
|
||||||
|
'स्थ': 116,
|
||||||
|
'ा थ': 117,
|
||||||
|
'ार्': 118,
|
||||||
|
' हु': 119,
|
||||||
|
'इरा': 120,
|
||||||
|
'एक ': 121,
|
||||||
|
'न क': 122,
|
||||||
|
'र म': 123,
|
||||||
|
'राक': 124,
|
||||||
|
'ी ज': 125,
|
||||||
|
'ी न': 126,
|
||||||
|
' इर': 127,
|
||||||
|
' उन': 128,
|
||||||
|
' पह': 129,
|
||||||
|
'कहा': 130,
|
||||||
|
'ते ': 131,
|
||||||
|
'े अ': 132,
|
||||||
|
' तो': 133,
|
||||||
|
' सु': 134,
|
||||||
|
'ति ': 135,
|
||||||
|
'ती ': 136,
|
||||||
|
'तो ': 137,
|
||||||
|
'मिल': 138,
|
||||||
|
'िक ': 139,
|
||||||
|
'ियो': 140,
|
||||||
|
'्रे': 141,
|
||||||
|
' अप': 142,
|
||||||
|
' फ़': 143,
|
||||||
|
' लि': 144,
|
||||||
|
' लो': 145,
|
||||||
|
' सम': 146,
|
||||||
|
'म क': 147,
|
||||||
|
'र्ट': 148,
|
||||||
|
'हो ': 149,
|
||||||
|
'ा च': 150,
|
||||||
|
'ाई ': 151,
|
||||||
|
'ाने': 152,
|
||||||
|
'िन ': 153,
|
||||||
|
'्य ': 154,
|
||||||
|
' उस': 155,
|
||||||
|
' क़': 156,
|
||||||
|
' सक': 157,
|
||||||
|
' सै': 158,
|
||||||
|
'ं प': 159,
|
||||||
|
'ं ह': 160,
|
||||||
|
'गी ': 161,
|
||||||
|
'त क': 162,
|
||||||
|
'मान': 163,
|
||||||
|
'र न': 164,
|
||||||
|
'ष्ट': 165,
|
||||||
|
'स क': 166,
|
||||||
|
'स्त': 167,
|
||||||
|
'ाँ ': 168,
|
||||||
|
'ी ब': 169,
|
||||||
|
'ी म': 170,
|
||||||
|
'्री': 171,
|
||||||
|
' दो': 172,
|
||||||
|
' मि': 173,
|
||||||
|
' मु': 174,
|
||||||
|
' ले': 175,
|
||||||
|
' शा': 176,
|
||||||
|
'ं स': 177,
|
||||||
|
'ज़ा': 178,
|
||||||
|
'त्र': 179,
|
||||||
|
'थी ': 180,
|
||||||
|
'लिए': 181,
|
||||||
|
'सी ': 182,
|
||||||
|
'़ा ': 183,
|
||||||
|
'़ार': 184,
|
||||||
|
'ांग': 185,
|
||||||
|
'े द': 186,
|
||||||
|
'े म': 187,
|
||||||
|
'्व ': 188,
|
||||||
|
' ना': 189,
|
||||||
|
' बन': 190,
|
||||||
|
'ंग्': 191,
|
||||||
|
'कां': 192,
|
||||||
|
'गा ': 193,
|
||||||
|
'ग्र': 194,
|
||||||
|
'जा ': 195,
|
||||||
|
'ज्य': 196,
|
||||||
|
'दी ': 197,
|
||||||
|
'न म': 198,
|
||||||
|
'पार': 199,
|
||||||
|
'भा ': 200,
|
||||||
|
'रही': 201,
|
||||||
|
'रे ': 202,
|
||||||
|
'रेस': 203,
|
||||||
|
'ली ': 204,
|
||||||
|
'सभा': 205,
|
||||||
|
'ा र': 206,
|
||||||
|
'ाल ': 207,
|
||||||
|
'ी अ': 208,
|
||||||
|
'ीकी': 209,
|
||||||
|
'े त': 210,
|
||||||
|
'ेश ': 211,
|
||||||
|
' अं': 212,
|
||||||
|
' तक': 213,
|
||||||
|
' या': 214,
|
||||||
|
'ई ह': 215,
|
||||||
|
'करन': 216,
|
||||||
|
'तक ': 217,
|
||||||
|
'देश': 218,
|
||||||
|
'वर्': 219,
|
||||||
|
'ाया': 220,
|
||||||
|
'ी भ': 221,
|
||||||
|
'ेस ': 222,
|
||||||
|
'्ष ': 223,
|
||||||
|
' गय': 224,
|
||||||
|
' जि': 225,
|
||||||
|
' थी': 226,
|
||||||
|
' बड': 227,
|
||||||
|
' यह': 228,
|
||||||
|
' वा': 229,
|
||||||
|
'ंतर': 230,
|
||||||
|
'अंत': 231,
|
||||||
|
'क़ ': 232,
|
||||||
|
'गया': 233,
|
||||||
|
'टी ': 234,
|
||||||
|
'निक': 235,
|
||||||
|
'न्ह': 236,
|
||||||
|
'पहल': 237,
|
||||||
|
'बड़': 238,
|
||||||
|
'मार': 239,
|
||||||
|
'र प': 240,
|
||||||
|
'रने': 241,
|
||||||
|
'ाज़': 242,
|
||||||
|
'ि इ': 243,
|
||||||
|
'ी र': 244,
|
||||||
|
'े ज': 245,
|
||||||
|
'े व': 246,
|
||||||
|
'्ट ': 247,
|
||||||
|
'्टी': 248,
|
||||||
|
' अब': 249,
|
||||||
|
' लग': 250,
|
||||||
|
' वर': 251,
|
||||||
|
' सी': 252,
|
||||||
|
'ं भ': 253,
|
||||||
|
'उन्': 254,
|
||||||
|
'क क': 255,
|
||||||
|
'किय': 256,
|
||||||
|
'देख': 257,
|
||||||
|
'पूर': 258,
|
||||||
|
'फ़्': 259,
|
||||||
|
'यह ': 260,
|
||||||
|
'यान': 261,
|
||||||
|
'रिक': 262,
|
||||||
|
'रिय': 263,
|
||||||
|
'र्ड': 264,
|
||||||
|
'लेक': 265,
|
||||||
|
'सकत': 266,
|
||||||
|
'हों': 267,
|
||||||
|
'होग': 268,
|
||||||
|
'ा अ': 269,
|
||||||
|
'ा द': 270,
|
||||||
|
'ा प': 271,
|
||||||
|
'ाद ': 272,
|
||||||
|
'ारा': 273,
|
||||||
|
'ित ': 274,
|
||||||
|
'ी त': 275,
|
||||||
|
'ी प': 276,
|
||||||
|
'ो क': 277,
|
||||||
|
'ो द': 278,
|
||||||
|
' ते': 279,
|
||||||
|
' नि': 280,
|
||||||
|
' सर': 281,
|
||||||
|
' हा': 282,
|
||||||
|
'ं द': 283,
|
||||||
|
'अपन': 284,
|
||||||
|
'जान': 285,
|
||||||
|
'त म': 286,
|
||||||
|
'थित': 287,
|
||||||
|
'पनी': 288,
|
||||||
|
'महल': 289,
|
||||||
|
'र ह': 290,
|
||||||
|
'लोग': 291,
|
||||||
|
'व क': 292,
|
||||||
|
'हना': 293,
|
||||||
|
'हल ': 294,
|
||||||
|
'हाँ': 295,
|
||||||
|
'ाज्': 296,
|
||||||
|
'ाना': 297,
|
||||||
|
'िक्': 298,
|
||||||
|
'िस्': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/hr.py
Normal file
303
libs/guess_language/data/models/hr.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'je ': 0,
|
||||||
|
' na': 1,
|
||||||
|
' pr': 2,
|
||||||
|
' po': 3,
|
||||||
|
'na ': 4,
|
||||||
|
' je': 5,
|
||||||
|
' za': 6,
|
||||||
|
'ije': 7,
|
||||||
|
'ne ': 8,
|
||||||
|
' i ': 9,
|
||||||
|
'ti ': 10,
|
||||||
|
'da ': 11,
|
||||||
|
' ko': 12,
|
||||||
|
' ne': 13,
|
||||||
|
'li ': 14,
|
||||||
|
' bi': 15,
|
||||||
|
' da': 16,
|
||||||
|
' u ': 17,
|
||||||
|
'ma ': 18,
|
||||||
|
'mo ': 19,
|
||||||
|
'a n': 20,
|
||||||
|
'ih ': 21,
|
||||||
|
'za ': 22,
|
||||||
|
'a s': 23,
|
||||||
|
'ko ': 24,
|
||||||
|
'i s': 25,
|
||||||
|
'a p': 26,
|
||||||
|
'koj': 27,
|
||||||
|
'pro': 28,
|
||||||
|
'ju ': 29,
|
||||||
|
'se ': 30,
|
||||||
|
' go': 31,
|
||||||
|
'ost': 32,
|
||||||
|
'to ': 33,
|
||||||
|
'va ': 34,
|
||||||
|
' do': 35,
|
||||||
|
' to': 36,
|
||||||
|
'e n': 37,
|
||||||
|
'i p': 38,
|
||||||
|
' od': 39,
|
||||||
|
' ra': 40,
|
||||||
|
'no ': 41,
|
||||||
|
'ako': 42,
|
||||||
|
'ka ': 43,
|
||||||
|
'ni ': 44,
|
||||||
|
' ka': 45,
|
||||||
|
' se': 46,
|
||||||
|
' mo': 47,
|
||||||
|
' st': 48,
|
||||||
|
'i n': 49,
|
||||||
|
'ima': 50,
|
||||||
|
'ja ': 51,
|
||||||
|
'pri': 52,
|
||||||
|
'vat': 53,
|
||||||
|
'sta': 54,
|
||||||
|
' su': 55,
|
||||||
|
'ati': 56,
|
||||||
|
'e p': 57,
|
||||||
|
'ta ': 58,
|
||||||
|
'tsk': 59,
|
||||||
|
'e i': 60,
|
||||||
|
'nij': 61,
|
||||||
|
' tr': 62,
|
||||||
|
'cij': 63,
|
||||||
|
'jen': 64,
|
||||||
|
'nos': 65,
|
||||||
|
'o s': 66,
|
||||||
|
' iz': 67,
|
||||||
|
'om ': 68,
|
||||||
|
'tro': 69,
|
||||||
|
'ili': 70,
|
||||||
|
'iti': 71,
|
||||||
|
'pos': 72,
|
||||||
|
' al': 73,
|
||||||
|
'a i': 74,
|
||||||
|
'a o': 75,
|
||||||
|
'e s': 76,
|
||||||
|
'ija': 77,
|
||||||
|
'ini': 78,
|
||||||
|
'pre': 79,
|
||||||
|
'str': 80,
|
||||||
|
'la ': 81,
|
||||||
|
'og ': 82,
|
||||||
|
'ovo': 83,
|
||||||
|
' sv': 84,
|
||||||
|
'ekt': 85,
|
||||||
|
'nje': 86,
|
||||||
|
'o p': 87,
|
||||||
|
'odi': 88,
|
||||||
|
'rva': 89,
|
||||||
|
' ni': 90,
|
||||||
|
'ali': 91,
|
||||||
|
'min': 92,
|
||||||
|
'rij': 93,
|
||||||
|
'a t': 94,
|
||||||
|
'a z': 95,
|
||||||
|
'ats': 96,
|
||||||
|
'iva': 97,
|
||||||
|
'o t': 98,
|
||||||
|
'od ': 99,
|
||||||
|
'oje': 100,
|
||||||
|
'ra ': 101,
|
||||||
|
' hr': 102,
|
||||||
|
'a m': 103,
|
||||||
|
'a u': 104,
|
||||||
|
'hrv': 105,
|
||||||
|
'im ': 106,
|
||||||
|
'ke ': 107,
|
||||||
|
'o i': 108,
|
||||||
|
'ovi': 109,
|
||||||
|
'red': 110,
|
||||||
|
'riv': 111,
|
||||||
|
'te ': 112,
|
||||||
|
'bi ': 113,
|
||||||
|
'e o': 114,
|
||||||
|
'god': 115,
|
||||||
|
'i d': 116,
|
||||||
|
'lek': 117,
|
||||||
|
'umi': 118,
|
||||||
|
'zvo': 119,
|
||||||
|
'din': 120,
|
||||||
|
'e u': 121,
|
||||||
|
'ene': 122,
|
||||||
|
'jed': 123,
|
||||||
|
'ji ': 124,
|
||||||
|
'lje': 125,
|
||||||
|
'nog': 126,
|
||||||
|
'su ': 127,
|
||||||
|
' a ': 128,
|
||||||
|
' el': 129,
|
||||||
|
' mi': 130,
|
||||||
|
' o ': 131,
|
||||||
|
'a d': 132,
|
||||||
|
'alu': 133,
|
||||||
|
'ele': 134,
|
||||||
|
'i u': 135,
|
||||||
|
'izv': 136,
|
||||||
|
'ktr': 137,
|
||||||
|
'lum': 138,
|
||||||
|
'o d': 139,
|
||||||
|
'ori': 140,
|
||||||
|
'rad': 141,
|
||||||
|
'sto': 142,
|
||||||
|
'a k': 143,
|
||||||
|
'anj': 144,
|
||||||
|
'ava': 145,
|
||||||
|
'e k': 146,
|
||||||
|
'men': 147,
|
||||||
|
'nic': 148,
|
||||||
|
'o j': 149,
|
||||||
|
'oj ': 150,
|
||||||
|
'ove': 151,
|
||||||
|
'ski': 152,
|
||||||
|
'tvr': 153,
|
||||||
|
'una': 154,
|
||||||
|
'vor': 155,
|
||||||
|
' di': 156,
|
||||||
|
' no': 157,
|
||||||
|
' s ': 158,
|
||||||
|
' ta': 159,
|
||||||
|
' tv': 160,
|
||||||
|
'i i': 161,
|
||||||
|
'i o': 162,
|
||||||
|
'kak': 163,
|
||||||
|
'roš': 164,
|
||||||
|
'sko': 165,
|
||||||
|
'vod': 166,
|
||||||
|
' sa': 167,
|
||||||
|
' će': 168,
|
||||||
|
'a b': 169,
|
||||||
|
'adi': 170,
|
||||||
|
'amo': 171,
|
||||||
|
'eni': 172,
|
||||||
|
'gov': 173,
|
||||||
|
'iju': 174,
|
||||||
|
'ku ': 175,
|
||||||
|
'o n': 176,
|
||||||
|
'ora': 177,
|
||||||
|
'rav': 178,
|
||||||
|
'ruj': 179,
|
||||||
|
'smo': 180,
|
||||||
|
'tav': 181,
|
||||||
|
'tru': 182,
|
||||||
|
'u p': 183,
|
||||||
|
've ': 184,
|
||||||
|
' in': 185,
|
||||||
|
' pl': 186,
|
||||||
|
'aci': 187,
|
||||||
|
'bit': 188,
|
||||||
|
'de ': 189,
|
||||||
|
'diš': 190,
|
||||||
|
'ema': 191,
|
||||||
|
'i m': 192,
|
||||||
|
'ika': 193,
|
||||||
|
'išt': 194,
|
||||||
|
'jer': 195,
|
||||||
|
'ki ': 196,
|
||||||
|
'mog': 197,
|
||||||
|
'nik': 198,
|
||||||
|
'nov': 199,
|
||||||
|
'nu ': 200,
|
||||||
|
'oji': 201,
|
||||||
|
'oli': 202,
|
||||||
|
'pla': 203,
|
||||||
|
'pod': 204,
|
||||||
|
'st ': 205,
|
||||||
|
'sti': 206,
|
||||||
|
'tra': 207,
|
||||||
|
'tre': 208,
|
||||||
|
'vo ': 209,
|
||||||
|
' sm': 210,
|
||||||
|
' št': 211,
|
||||||
|
'dan': 212,
|
||||||
|
'e z': 213,
|
||||||
|
'i t': 214,
|
||||||
|
'io ': 215,
|
||||||
|
'ist': 216,
|
||||||
|
'kon': 217,
|
||||||
|
'lo ': 218,
|
||||||
|
'stv': 219,
|
||||||
|
'u s': 220,
|
||||||
|
'uje': 221,
|
||||||
|
'ust': 222,
|
||||||
|
'će ': 223,
|
||||||
|
'ći ': 224,
|
||||||
|
'što': 225,
|
||||||
|
' dr': 226,
|
||||||
|
' im': 227,
|
||||||
|
' li': 228,
|
||||||
|
'ada': 229,
|
||||||
|
'aft': 230,
|
||||||
|
'ani': 231,
|
||||||
|
'ao ': 232,
|
||||||
|
'ars': 233,
|
||||||
|
'ata': 234,
|
||||||
|
'e t': 235,
|
||||||
|
'emo': 236,
|
||||||
|
'i k': 237,
|
||||||
|
'ine': 238,
|
||||||
|
'jem': 239,
|
||||||
|
'kov': 240,
|
||||||
|
'lik': 241,
|
||||||
|
'lji': 242,
|
||||||
|
'mje': 243,
|
||||||
|
'naf': 244,
|
||||||
|
'ner': 245,
|
||||||
|
'nih': 246,
|
||||||
|
'nja': 247,
|
||||||
|
'ogo': 248,
|
||||||
|
'oiz': 249,
|
||||||
|
'ome': 250,
|
||||||
|
'pot': 251,
|
||||||
|
'ran': 252,
|
||||||
|
'ri ': 253,
|
||||||
|
'roi': 254,
|
||||||
|
'rtk': 255,
|
||||||
|
'ska': 256,
|
||||||
|
'ter': 257,
|
||||||
|
'u i': 258,
|
||||||
|
'u o': 259,
|
||||||
|
'vi ': 260,
|
||||||
|
'vrt': 261,
|
||||||
|
' me': 262,
|
||||||
|
' ug': 263,
|
||||||
|
'ak ': 264,
|
||||||
|
'ama': 265,
|
||||||
|
'drž': 266,
|
||||||
|
'e e': 267,
|
||||||
|
'e g': 268,
|
||||||
|
'e m': 269,
|
||||||
|
'em ': 270,
|
||||||
|
'eme': 271,
|
||||||
|
'enj': 272,
|
||||||
|
'ent': 273,
|
||||||
|
'er ': 274,
|
||||||
|
'ere': 275,
|
||||||
|
'erg': 276,
|
||||||
|
'eur': 277,
|
||||||
|
'go ': 278,
|
||||||
|
'i b': 279,
|
||||||
|
'i z': 280,
|
||||||
|
'jet': 281,
|
||||||
|
'ksi': 282,
|
||||||
|
'o u': 283,
|
||||||
|
'oda': 284,
|
||||||
|
'ona': 285,
|
||||||
|
'pra': 286,
|
||||||
|
'reb': 287,
|
||||||
|
'rem': 288,
|
||||||
|
'rop': 289,
|
||||||
|
'tri': 290,
|
||||||
|
'žav': 291,
|
||||||
|
' ci': 292,
|
||||||
|
' eu': 293,
|
||||||
|
' re': 294,
|
||||||
|
' te': 295,
|
||||||
|
' uv': 296,
|
||||||
|
' ve': 297,
|
||||||
|
'aju': 298,
|
||||||
|
'an ': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/hu.py
Normal file
303
libs/guess_language/data/models/hu.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
' a ': 0,
|
||||||
|
' az': 1,
|
||||||
|
' sz': 2,
|
||||||
|
'az ': 3,
|
||||||
|
' me': 4,
|
||||||
|
'en ': 5,
|
||||||
|
' el': 6,
|
||||||
|
' ho': 7,
|
||||||
|
'ek ': 8,
|
||||||
|
'gy ': 9,
|
||||||
|
'tt ': 10,
|
||||||
|
'ett': 11,
|
||||||
|
'sze': 12,
|
||||||
|
' fe': 13,
|
||||||
|
'és ': 14,
|
||||||
|
' ki': 15,
|
||||||
|
'tet': 16,
|
||||||
|
' be': 17,
|
||||||
|
'et ': 18,
|
||||||
|
'ter': 19,
|
||||||
|
' kö': 20,
|
||||||
|
' és': 21,
|
||||||
|
'hog': 22,
|
||||||
|
'meg': 23,
|
||||||
|
'ogy': 24,
|
||||||
|
'szt': 25,
|
||||||
|
'te ': 26,
|
||||||
|
't a': 27,
|
||||||
|
'zet': 28,
|
||||||
|
'a m': 29,
|
||||||
|
'nek': 30,
|
||||||
|
'nt ': 31,
|
||||||
|
'ség': 32,
|
||||||
|
'szá': 33,
|
||||||
|
'ak ': 34,
|
||||||
|
' va': 35,
|
||||||
|
'an ': 36,
|
||||||
|
'eze': 37,
|
||||||
|
'ra ': 38,
|
||||||
|
'ta ': 39,
|
||||||
|
' mi': 40,
|
||||||
|
'int': 41,
|
||||||
|
'köz': 42,
|
||||||
|
' is': 43,
|
||||||
|
'esz': 44,
|
||||||
|
'fel': 45,
|
||||||
|
'min': 46,
|
||||||
|
'nak': 47,
|
||||||
|
'ors': 48,
|
||||||
|
'zer': 49,
|
||||||
|
' te': 50,
|
||||||
|
'a a': 51,
|
||||||
|
'a k': 52,
|
||||||
|
'is ': 53,
|
||||||
|
' cs': 54,
|
||||||
|
'ele': 55,
|
||||||
|
'er ': 56,
|
||||||
|
'men': 57,
|
||||||
|
'si ': 58,
|
||||||
|
'tek': 59,
|
||||||
|
'ti ': 60,
|
||||||
|
' ne': 61,
|
||||||
|
'csa': 62,
|
||||||
|
'ent': 63,
|
||||||
|
'z e': 64,
|
||||||
|
'a t': 65,
|
||||||
|
'ala': 66,
|
||||||
|
'ere': 67,
|
||||||
|
'es ': 68,
|
||||||
|
'lom': 69,
|
||||||
|
'lte': 70,
|
||||||
|
'mon': 71,
|
||||||
|
'ond': 72,
|
||||||
|
'rsz': 73,
|
||||||
|
'sza': 74,
|
||||||
|
'tte': 75,
|
||||||
|
'zág': 76,
|
||||||
|
'ány': 77,
|
||||||
|
' fo': 78,
|
||||||
|
' ma': 79,
|
||||||
|
'ai ': 80,
|
||||||
|
'ben': 81,
|
||||||
|
'el ': 82,
|
||||||
|
'ene': 83,
|
||||||
|
'ik ': 84,
|
||||||
|
'jel': 85,
|
||||||
|
'tás': 86,
|
||||||
|
'áll': 87,
|
||||||
|
' ha': 88,
|
||||||
|
' le': 89,
|
||||||
|
' ál': 90,
|
||||||
|
'agy': 91,
|
||||||
|
'alá': 92,
|
||||||
|
'isz': 93,
|
||||||
|
'y a': 94,
|
||||||
|
'zte': 95,
|
||||||
|
'ás ': 96,
|
||||||
|
' al': 97,
|
||||||
|
'e a': 98,
|
||||||
|
'egy': 99,
|
||||||
|
'ely': 100,
|
||||||
|
'for': 101,
|
||||||
|
'lat': 102,
|
||||||
|
'lt ': 103,
|
||||||
|
'n a': 104,
|
||||||
|
'oga': 105,
|
||||||
|
'on ': 106,
|
||||||
|
're ': 107,
|
||||||
|
'st ': 108,
|
||||||
|
'ság': 109,
|
||||||
|
't m': 110,
|
||||||
|
'án ': 111,
|
||||||
|
'ét ': 112,
|
||||||
|
'ült': 113,
|
||||||
|
' je': 114,
|
||||||
|
'gi ': 115,
|
||||||
|
'k a': 116,
|
||||||
|
'kül': 117,
|
||||||
|
'lam': 118,
|
||||||
|
'len': 119,
|
||||||
|
'lás': 120,
|
||||||
|
'más': 121,
|
||||||
|
's k': 122,
|
||||||
|
'vez': 123,
|
||||||
|
'áso': 124,
|
||||||
|
'özö': 125,
|
||||||
|
' ta': 126,
|
||||||
|
'a s': 127,
|
||||||
|
'a v': 128,
|
||||||
|
'asz': 129,
|
||||||
|
'atá': 130,
|
||||||
|
'ető': 131,
|
||||||
|
'kez': 132,
|
||||||
|
'let': 133,
|
||||||
|
'mag': 134,
|
||||||
|
'nem': 135,
|
||||||
|
'szé': 136,
|
||||||
|
'z m': 137,
|
||||||
|
'át ': 138,
|
||||||
|
'éte': 139,
|
||||||
|
'ölt': 140,
|
||||||
|
' de': 141,
|
||||||
|
' gy': 142,
|
||||||
|
' ké': 143,
|
||||||
|
' mo': 144,
|
||||||
|
' vá': 145,
|
||||||
|
' ér': 146,
|
||||||
|
'a b': 147,
|
||||||
|
'a f': 148,
|
||||||
|
'ami': 149,
|
||||||
|
'at ': 150,
|
||||||
|
'ato': 151,
|
||||||
|
'att': 152,
|
||||||
|
'bef': 153,
|
||||||
|
'dta': 154,
|
||||||
|
'gya': 155,
|
||||||
|
'hat': 156,
|
||||||
|
'i s': 157,
|
||||||
|
'las': 158,
|
||||||
|
'ndt': 159,
|
||||||
|
'rt ': 160,
|
||||||
|
'szo': 161,
|
||||||
|
't k': 162,
|
||||||
|
'tár': 163,
|
||||||
|
'tés': 164,
|
||||||
|
'van': 165,
|
||||||
|
'ásá': 166,
|
||||||
|
'ól ': 167,
|
||||||
|
' bé': 168,
|
||||||
|
' eg': 169,
|
||||||
|
' or': 170,
|
||||||
|
' pá': 171,
|
||||||
|
' pé': 172,
|
||||||
|
' ve': 173,
|
||||||
|
'ban': 174,
|
||||||
|
'eke': 175,
|
||||||
|
'ekü': 176,
|
||||||
|
'elő': 177,
|
||||||
|
'erv': 178,
|
||||||
|
'ete': 179,
|
||||||
|
'fog': 180,
|
||||||
|
'i a': 181,
|
||||||
|
'kis': 182,
|
||||||
|
'lád': 183,
|
||||||
|
'nte': 184,
|
||||||
|
'nye': 185,
|
||||||
|
'nyi': 186,
|
||||||
|
'ok ': 187,
|
||||||
|
'omá': 188,
|
||||||
|
'os ': 189,
|
||||||
|
'rán': 190,
|
||||||
|
'rás': 191,
|
||||||
|
'sal': 192,
|
||||||
|
't e': 193,
|
||||||
|
'vál': 194,
|
||||||
|
'yar': 195,
|
||||||
|
'ágo': 196,
|
||||||
|
'ála': 197,
|
||||||
|
'ége': 198,
|
||||||
|
'ény': 199,
|
||||||
|
'ött': 200,
|
||||||
|
' tá': 201,
|
||||||
|
'adó': 202,
|
||||||
|
'elh': 203,
|
||||||
|
'fej': 204,
|
||||||
|
'het': 205,
|
||||||
|
'hoz': 206,
|
||||||
|
'ill': 207,
|
||||||
|
'jár': 208,
|
||||||
|
'kés': 209,
|
||||||
|
'llo': 210,
|
||||||
|
'mi ': 211,
|
||||||
|
'ny ': 212,
|
||||||
|
'ont': 213,
|
||||||
|
'ren': 214,
|
||||||
|
'res': 215,
|
||||||
|
'rin': 216,
|
||||||
|
's a': 217,
|
||||||
|
's e': 218,
|
||||||
|
'ssz': 219,
|
||||||
|
'zt ': 220,
|
||||||
|
' ez': 221,
|
||||||
|
' ka': 222,
|
||||||
|
' ke': 223,
|
||||||
|
' ko': 224,
|
||||||
|
' re': 225,
|
||||||
|
'a h': 226,
|
||||||
|
'a n': 227,
|
||||||
|
'den': 228,
|
||||||
|
'dó ': 229,
|
||||||
|
'efo': 230,
|
||||||
|
'gad': 231,
|
||||||
|
'gat': 232,
|
||||||
|
'gye': 233,
|
||||||
|
'hel': 234,
|
||||||
|
'k e': 235,
|
||||||
|
'ket': 236,
|
||||||
|
'les': 237,
|
||||||
|
'mán': 238,
|
||||||
|
'nde': 239,
|
||||||
|
'nis': 240,
|
||||||
|
'ozz': 241,
|
||||||
|
't b': 242,
|
||||||
|
't i': 243,
|
||||||
|
't é': 244,
|
||||||
|
'tat': 245,
|
||||||
|
'tos': 246,
|
||||||
|
'val': 247,
|
||||||
|
'z o': 248,
|
||||||
|
'zak': 249,
|
||||||
|
'ád ': 250,
|
||||||
|
'ály': 251,
|
||||||
|
'ára': 252,
|
||||||
|
'ési': 253,
|
||||||
|
'ész': 254,
|
||||||
|
' ak': 255,
|
||||||
|
' am': 256,
|
||||||
|
' es': 257,
|
||||||
|
' há': 258,
|
||||||
|
' ny': 259,
|
||||||
|
' tö': 260,
|
||||||
|
'aka': 261,
|
||||||
|
'art': 262,
|
||||||
|
'ató': 263,
|
||||||
|
'azt': 264,
|
||||||
|
'bbe': 265,
|
||||||
|
'ber': 266,
|
||||||
|
'ció': 267,
|
||||||
|
'cso': 268,
|
||||||
|
'em ': 269,
|
||||||
|
'eti': 270,
|
||||||
|
'eté': 271,
|
||||||
|
'gal': 272,
|
||||||
|
'i t': 273,
|
||||||
|
'ini': 274,
|
||||||
|
'ist': 275,
|
||||||
|
'ja ': 276,
|
||||||
|
'ker': 277,
|
||||||
|
'ki ': 278,
|
||||||
|
'kor': 279,
|
||||||
|
'koz': 280,
|
||||||
|
'l é': 281,
|
||||||
|
'ljá': 282,
|
||||||
|
'lye': 283,
|
||||||
|
'n v': 284,
|
||||||
|
'ni ': 285,
|
||||||
|
'pál': 286,
|
||||||
|
'ror': 287,
|
||||||
|
'ról': 288,
|
||||||
|
'rül': 289,
|
||||||
|
's c': 290,
|
||||||
|
's p': 291,
|
||||||
|
's s': 292,
|
||||||
|
's v': 293,
|
||||||
|
'sok': 294,
|
||||||
|
't j': 295,
|
||||||
|
't t': 296,
|
||||||
|
'tar': 297,
|
||||||
|
'tel': 298,
|
||||||
|
'vat': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/id.py
Normal file
303
libs/guess_language/data/models/id.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'an ': 0,
|
||||||
|
' me': 1,
|
||||||
|
'kan': 2,
|
||||||
|
'ang': 3,
|
||||||
|
'ng ': 4,
|
||||||
|
' pe': 5,
|
||||||
|
'men': 6,
|
||||||
|
' di': 7,
|
||||||
|
' ke': 8,
|
||||||
|
' da': 9,
|
||||||
|
' se': 10,
|
||||||
|
'eng': 11,
|
||||||
|
' be': 12,
|
||||||
|
'nga': 13,
|
||||||
|
'nya': 14,
|
||||||
|
' te': 15,
|
||||||
|
'ah ': 16,
|
||||||
|
'ber': 17,
|
||||||
|
'aka': 18,
|
||||||
|
' ya': 19,
|
||||||
|
'dan': 20,
|
||||||
|
'di ': 21,
|
||||||
|
'yan': 22,
|
||||||
|
'n p': 23,
|
||||||
|
'per': 24,
|
||||||
|
'a m': 25,
|
||||||
|
'ita': 26,
|
||||||
|
' pa': 27,
|
||||||
|
'da ': 28,
|
||||||
|
'ata': 29,
|
||||||
|
'ada': 30,
|
||||||
|
'ya ': 31,
|
||||||
|
'ta ': 32,
|
||||||
|
' in': 33,
|
||||||
|
'ala': 34,
|
||||||
|
'eri': 35,
|
||||||
|
'ia ': 36,
|
||||||
|
'a d': 37,
|
||||||
|
'n k': 38,
|
||||||
|
'am ': 39,
|
||||||
|
'ga ': 40,
|
||||||
|
'at ': 41,
|
||||||
|
'era': 42,
|
||||||
|
'n d': 43,
|
||||||
|
'ter': 44,
|
||||||
|
' ka': 45,
|
||||||
|
'a p': 46,
|
||||||
|
'ari': 47,
|
||||||
|
'emb': 48,
|
||||||
|
'n m': 49,
|
||||||
|
'ri ': 50,
|
||||||
|
' ba': 51,
|
||||||
|
'aan': 52,
|
||||||
|
'ak ': 53,
|
||||||
|
'ra ': 54,
|
||||||
|
' it': 55,
|
||||||
|
'ara': 56,
|
||||||
|
'ela': 57,
|
||||||
|
'ni ': 58,
|
||||||
|
'ali': 59,
|
||||||
|
'ran': 60,
|
||||||
|
'ar ': 61,
|
||||||
|
'eru': 62,
|
||||||
|
'lah': 63,
|
||||||
|
'a b': 64,
|
||||||
|
'asi': 65,
|
||||||
|
'awa': 66,
|
||||||
|
'eba': 67,
|
||||||
|
'gan': 68,
|
||||||
|
'n b': 69,
|
||||||
|
' ha': 70,
|
||||||
|
'ini': 71,
|
||||||
|
'mer': 72,
|
||||||
|
' la': 73,
|
||||||
|
' mi': 74,
|
||||||
|
'and': 75,
|
||||||
|
'ena': 76,
|
||||||
|
'wan': 77,
|
||||||
|
' sa': 78,
|
||||||
|
'aha': 79,
|
||||||
|
'lam': 80,
|
||||||
|
'n i': 81,
|
||||||
|
'nda': 82,
|
||||||
|
' wa': 83,
|
||||||
|
'a i': 84,
|
||||||
|
'dua': 85,
|
||||||
|
'g m': 86,
|
||||||
|
'mi ': 87,
|
||||||
|
'n a': 88,
|
||||||
|
'rus': 89,
|
||||||
|
'tel': 90,
|
||||||
|
'yak': 91,
|
||||||
|
' an': 92,
|
||||||
|
'dal': 93,
|
||||||
|
'h d': 94,
|
||||||
|
'i s': 95,
|
||||||
|
'ing': 96,
|
||||||
|
'min': 97,
|
||||||
|
'ngg': 98,
|
||||||
|
'tak': 99,
|
||||||
|
'ami': 100,
|
||||||
|
'beb': 101,
|
||||||
|
'den': 102,
|
||||||
|
'gat': 103,
|
||||||
|
'ian': 104,
|
||||||
|
'ih ': 105,
|
||||||
|
'pad': 106,
|
||||||
|
'rga': 107,
|
||||||
|
'san': 108,
|
||||||
|
'ua ': 109,
|
||||||
|
' de': 110,
|
||||||
|
'a t': 111,
|
||||||
|
'arg': 112,
|
||||||
|
'dar': 113,
|
||||||
|
'elu': 114,
|
||||||
|
'har': 115,
|
||||||
|
'i k': 116,
|
||||||
|
'i m': 117,
|
||||||
|
'i p': 118,
|
||||||
|
'ika': 119,
|
||||||
|
'in ': 120,
|
||||||
|
'iny': 121,
|
||||||
|
'itu': 122,
|
||||||
|
'mba': 123,
|
||||||
|
'n t': 124,
|
||||||
|
'ntu': 125,
|
||||||
|
'pan': 126,
|
||||||
|
'pen': 127,
|
||||||
|
'sah': 128,
|
||||||
|
'tan': 129,
|
||||||
|
'tu ': 130,
|
||||||
|
'a k': 131,
|
||||||
|
'ban': 132,
|
||||||
|
'edu': 133,
|
||||||
|
'eka': 134,
|
||||||
|
'g d': 135,
|
||||||
|
'ka ': 136,
|
||||||
|
'ker': 137,
|
||||||
|
'nde': 138,
|
||||||
|
'nta': 139,
|
||||||
|
'ora': 140,
|
||||||
|
'usa': 141,
|
||||||
|
' du': 142,
|
||||||
|
' ma': 143,
|
||||||
|
'a s': 144,
|
||||||
|
'ai ': 145,
|
||||||
|
'ant': 146,
|
||||||
|
'bas': 147,
|
||||||
|
'end': 148,
|
||||||
|
'i d': 149,
|
||||||
|
'ira': 150,
|
||||||
|
'kam': 151,
|
||||||
|
'lan': 152,
|
||||||
|
'n s': 153,
|
||||||
|
'uli': 154,
|
||||||
|
'al ': 155,
|
||||||
|
'apa': 156,
|
||||||
|
'ere': 157,
|
||||||
|
'ert': 158,
|
||||||
|
'lia': 159,
|
||||||
|
'mem': 160,
|
||||||
|
'rka': 161,
|
||||||
|
'si ': 162,
|
||||||
|
'tal': 163,
|
||||||
|
'ung': 164,
|
||||||
|
' ak': 165,
|
||||||
|
'a a': 166,
|
||||||
|
'a w': 167,
|
||||||
|
'ani': 168,
|
||||||
|
'ask': 169,
|
||||||
|
'ent': 170,
|
||||||
|
'gar': 171,
|
||||||
|
'haa': 172,
|
||||||
|
'i i': 173,
|
||||||
|
'isa': 174,
|
||||||
|
'ked': 175,
|
||||||
|
'mbe': 176,
|
||||||
|
'ska': 177,
|
||||||
|
'tor': 178,
|
||||||
|
'uan': 179,
|
||||||
|
'uk ': 180,
|
||||||
|
'uka': 181,
|
||||||
|
' ad': 182,
|
||||||
|
' to': 183,
|
||||||
|
'asa': 184,
|
||||||
|
'aya': 185,
|
||||||
|
'bag': 186,
|
||||||
|
'dia': 187,
|
||||||
|
'dun': 188,
|
||||||
|
'erj': 189,
|
||||||
|
'mas': 190,
|
||||||
|
'na ': 191,
|
||||||
|
'rek': 192,
|
||||||
|
'rit': 193,
|
||||||
|
'sih': 194,
|
||||||
|
'us ': 195,
|
||||||
|
' bi': 196,
|
||||||
|
'a h': 197,
|
||||||
|
'ama': 198,
|
||||||
|
'dib': 199,
|
||||||
|
'ers': 200,
|
||||||
|
'g s': 201,
|
||||||
|
'han': 202,
|
||||||
|
'ik ': 203,
|
||||||
|
'kem': 204,
|
||||||
|
'ma ': 205,
|
||||||
|
'n l': 206,
|
||||||
|
'nit': 207,
|
||||||
|
'r b': 208,
|
||||||
|
'rja': 209,
|
||||||
|
'sa ': 210,
|
||||||
|
' ju': 211,
|
||||||
|
' or': 212,
|
||||||
|
' si': 213,
|
||||||
|
' ti': 214,
|
||||||
|
'a y': 215,
|
||||||
|
'aga': 216,
|
||||||
|
'any': 217,
|
||||||
|
'as ': 218,
|
||||||
|
'cul': 219,
|
||||||
|
'eme': 220,
|
||||||
|
'emu': 221,
|
||||||
|
'eny': 222,
|
||||||
|
'epa': 223,
|
||||||
|
'erb': 224,
|
||||||
|
'erl': 225,
|
||||||
|
'gi ': 226,
|
||||||
|
'h m': 227,
|
||||||
|
'i a': 228,
|
||||||
|
'kel': 229,
|
||||||
|
'li ': 230,
|
||||||
|
'mel': 231,
|
||||||
|
'nia': 232,
|
||||||
|
'opa': 233,
|
||||||
|
'rta': 234,
|
||||||
|
'sia': 235,
|
||||||
|
'tah': 236,
|
||||||
|
'ula': 237,
|
||||||
|
'un ': 238,
|
||||||
|
'unt': 239,
|
||||||
|
' at': 240,
|
||||||
|
' bu': 241,
|
||||||
|
' pu': 242,
|
||||||
|
' ta': 243,
|
||||||
|
'agi': 244,
|
||||||
|
'alu': 245,
|
||||||
|
'amb': 246,
|
||||||
|
'bah': 247,
|
||||||
|
'bis': 248,
|
||||||
|
'er ': 249,
|
||||||
|
'i t': 250,
|
||||||
|
'ibe': 251,
|
||||||
|
'ir ': 252,
|
||||||
|
'ja ': 253,
|
||||||
|
'k m': 254,
|
||||||
|
'kar': 255,
|
||||||
|
'lai': 256,
|
||||||
|
'lal': 257,
|
||||||
|
'lu ': 258,
|
||||||
|
'mpa': 259,
|
||||||
|
'ngk': 260,
|
||||||
|
'nja': 261,
|
||||||
|
'or ': 262,
|
||||||
|
'pa ': 263,
|
||||||
|
'pas': 264,
|
||||||
|
'pem': 265,
|
||||||
|
'rak': 266,
|
||||||
|
'rik': 267,
|
||||||
|
'seb': 268,
|
||||||
|
'tam': 269,
|
||||||
|
'tem': 270,
|
||||||
|
'top': 271,
|
||||||
|
'tuk': 272,
|
||||||
|
'uni': 273,
|
||||||
|
'war': 274,
|
||||||
|
' al': 275,
|
||||||
|
' ga': 276,
|
||||||
|
' ge': 277,
|
||||||
|
' ir': 278,
|
||||||
|
' ja': 279,
|
||||||
|
' mu': 280,
|
||||||
|
' na': 281,
|
||||||
|
' pr': 282,
|
||||||
|
' su': 283,
|
||||||
|
' un': 284,
|
||||||
|
'ad ': 285,
|
||||||
|
'adi': 286,
|
||||||
|
'akt': 287,
|
||||||
|
'ann': 288,
|
||||||
|
'apo': 289,
|
||||||
|
'bel': 290,
|
||||||
|
'bul': 291,
|
||||||
|
'der': 292,
|
||||||
|
'ega': 293,
|
||||||
|
'eke': 294,
|
||||||
|
'ema': 295,
|
||||||
|
'emp': 296,
|
||||||
|
'ene': 297,
|
||||||
|
'enj': 298,
|
||||||
|
'esa': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/is.py
Normal file
303
libs/guess_language/data/models/is.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'að ': 0,
|
||||||
|
'um ': 1,
|
||||||
|
' að': 2,
|
||||||
|
'ir ': 3,
|
||||||
|
'ið ': 4,
|
||||||
|
'ur ': 5,
|
||||||
|
' ve': 6,
|
||||||
|
' í ': 7,
|
||||||
|
'na ': 8,
|
||||||
|
' á ': 9,
|
||||||
|
' se': 10,
|
||||||
|
' er': 11,
|
||||||
|
' og': 12,
|
||||||
|
'ar ': 13,
|
||||||
|
'og ': 14,
|
||||||
|
'ver': 15,
|
||||||
|
' mi': 16,
|
||||||
|
'inn': 17,
|
||||||
|
'nn ': 18,
|
||||||
|
' fy': 19,
|
||||||
|
'er ': 20,
|
||||||
|
'fyr': 21,
|
||||||
|
' ek': 22,
|
||||||
|
' en': 23,
|
||||||
|
' ha': 24,
|
||||||
|
' he': 25,
|
||||||
|
'ekk': 26,
|
||||||
|
' st': 27,
|
||||||
|
'ki ': 28,
|
||||||
|
'st ': 29,
|
||||||
|
'ði ': 30,
|
||||||
|
' ba': 31,
|
||||||
|
' me': 32,
|
||||||
|
' vi': 33,
|
||||||
|
'ig ': 34,
|
||||||
|
'rir': 35,
|
||||||
|
'yri': 36,
|
||||||
|
' um': 37,
|
||||||
|
'g f': 38,
|
||||||
|
'leg': 39,
|
||||||
|
'lei': 40,
|
||||||
|
'ns ': 41,
|
||||||
|
'ð s': 42,
|
||||||
|
' ei': 43,
|
||||||
|
' þa': 44,
|
||||||
|
'in ': 45,
|
||||||
|
'kki': 46,
|
||||||
|
'r h': 47,
|
||||||
|
'r s': 48,
|
||||||
|
'egi': 49,
|
||||||
|
'ein': 50,
|
||||||
|
'ga ': 51,
|
||||||
|
'ing': 52,
|
||||||
|
'ra ': 53,
|
||||||
|
'sta': 54,
|
||||||
|
' va': 55,
|
||||||
|
' þe': 56,
|
||||||
|
'ann': 57,
|
||||||
|
'en ': 58,
|
||||||
|
'mil': 59,
|
||||||
|
'sem': 60,
|
||||||
|
'tjó': 61,
|
||||||
|
'arð': 62,
|
||||||
|
'di ': 63,
|
||||||
|
'eit': 64,
|
||||||
|
'haf': 65,
|
||||||
|
'ill': 66,
|
||||||
|
'ins': 67,
|
||||||
|
'ist': 68,
|
||||||
|
'llj': 69,
|
||||||
|
'ndi': 70,
|
||||||
|
'r a': 71,
|
||||||
|
'r e': 72,
|
||||||
|
'seg': 73,
|
||||||
|
'un ': 74,
|
||||||
|
'var': 75,
|
||||||
|
' bi': 76,
|
||||||
|
' el': 77,
|
||||||
|
' fo': 78,
|
||||||
|
' ge': 79,
|
||||||
|
' yf': 80,
|
||||||
|
'and': 81,
|
||||||
|
'aug': 82,
|
||||||
|
'bau': 83,
|
||||||
|
'big': 84,
|
||||||
|
'ega': 85,
|
||||||
|
'eld': 86,
|
||||||
|
'erð': 87,
|
||||||
|
'fir': 88,
|
||||||
|
'foo': 89,
|
||||||
|
'gin': 90,
|
||||||
|
'itt': 91,
|
||||||
|
'n s': 92,
|
||||||
|
'ngi': 93,
|
||||||
|
'num': 94,
|
||||||
|
'od ': 95,
|
||||||
|
'ood': 96,
|
||||||
|
'sin': 97,
|
||||||
|
'ta ': 98,
|
||||||
|
'tt ': 99,
|
||||||
|
'við': 100,
|
||||||
|
'yfi': 101,
|
||||||
|
'ð e': 102,
|
||||||
|
'ð f': 103,
|
||||||
|
' hr': 104,
|
||||||
|
' sé': 105,
|
||||||
|
' þv': 106,
|
||||||
|
'a e': 107,
|
||||||
|
'a á': 108,
|
||||||
|
'em ': 109,
|
||||||
|
'gi ': 110,
|
||||||
|
'i f': 111,
|
||||||
|
'jar': 112,
|
||||||
|
'jór': 113,
|
||||||
|
'lja': 114,
|
||||||
|
'm e': 115,
|
||||||
|
'r á': 116,
|
||||||
|
'rei': 117,
|
||||||
|
'rst': 118,
|
||||||
|
'rða': 119,
|
||||||
|
'rði': 120,
|
||||||
|
'rðu': 121,
|
||||||
|
'stj': 122,
|
||||||
|
'und': 123,
|
||||||
|
'veg': 124,
|
||||||
|
'ví ': 125,
|
||||||
|
'ð v': 126,
|
||||||
|
'það': 127,
|
||||||
|
'því': 128,
|
||||||
|
' fj': 129,
|
||||||
|
' ko': 130,
|
||||||
|
' sl': 131,
|
||||||
|
'eik': 132,
|
||||||
|
'end': 133,
|
||||||
|
'ert': 134,
|
||||||
|
'ess': 135,
|
||||||
|
'fjá': 136,
|
||||||
|
'fur': 137,
|
||||||
|
'gir': 138,
|
||||||
|
'hús': 139,
|
||||||
|
'jár': 140,
|
||||||
|
'n e': 141,
|
||||||
|
'ri ': 142,
|
||||||
|
'tar': 143,
|
||||||
|
'ð þ': 144,
|
||||||
|
'ðar': 145,
|
||||||
|
'ður': 146,
|
||||||
|
'þes': 147,
|
||||||
|
' br': 148,
|
||||||
|
' hú': 149,
|
||||||
|
' kr': 150,
|
||||||
|
' le': 151,
|
||||||
|
' up': 152,
|
||||||
|
'a s': 153,
|
||||||
|
'egg': 154,
|
||||||
|
'i s': 155,
|
||||||
|
'irt': 156,
|
||||||
|
'ja ': 157,
|
||||||
|
'kið': 158,
|
||||||
|
'len': 159,
|
||||||
|
'með': 160,
|
||||||
|
'mik': 161,
|
||||||
|
'n b': 162,
|
||||||
|
'nar': 163,
|
||||||
|
'nir': 164,
|
||||||
|
'nun': 165,
|
||||||
|
'r f': 166,
|
||||||
|
'r v': 167,
|
||||||
|
'rið': 168,
|
||||||
|
'rt ': 169,
|
||||||
|
'sti': 170,
|
||||||
|
't v': 171,
|
||||||
|
'ti ': 172,
|
||||||
|
'una': 173,
|
||||||
|
'upp': 174,
|
||||||
|
'ða ': 175,
|
||||||
|
'óna': 176,
|
||||||
|
' al': 177,
|
||||||
|
' fr': 178,
|
||||||
|
' gr': 179,
|
||||||
|
'a v': 180,
|
||||||
|
'all': 181,
|
||||||
|
'an ': 182,
|
||||||
|
'da ': 183,
|
||||||
|
'eið': 184,
|
||||||
|
'eð ': 185,
|
||||||
|
'fa ': 186,
|
||||||
|
'fra': 187,
|
||||||
|
'g e': 188,
|
||||||
|
'ger': 189,
|
||||||
|
'gið': 190,
|
||||||
|
'gt ': 191,
|
||||||
|
'han': 192,
|
||||||
|
'hef': 193,
|
||||||
|
'hel': 194,
|
||||||
|
'her': 195,
|
||||||
|
'hra': 196,
|
||||||
|
'i a': 197,
|
||||||
|
'i e': 198,
|
||||||
|
'i v': 199,
|
||||||
|
'i þ': 200,
|
||||||
|
'iki': 201,
|
||||||
|
'jón': 202,
|
||||||
|
'jör': 203,
|
||||||
|
'ka ': 204,
|
||||||
|
'kró': 205,
|
||||||
|
'lík': 206,
|
||||||
|
'm h': 207,
|
||||||
|
'n a': 208,
|
||||||
|
'nga': 209,
|
||||||
|
'r l': 210,
|
||||||
|
'ram': 211,
|
||||||
|
'ru ': 212,
|
||||||
|
'ráð': 213,
|
||||||
|
'rón': 214,
|
||||||
|
'svo': 215,
|
||||||
|
'vin': 216,
|
||||||
|
'í b': 217,
|
||||||
|
'í h': 218,
|
||||||
|
'ð h': 219,
|
||||||
|
'ð k': 220,
|
||||||
|
'ð m': 221,
|
||||||
|
'örð': 222,
|
||||||
|
' af': 223,
|
||||||
|
' fa': 224,
|
||||||
|
' lí': 225,
|
||||||
|
' rá': 226,
|
||||||
|
' sk': 227,
|
||||||
|
' sv': 228,
|
||||||
|
' te': 229,
|
||||||
|
'a b': 230,
|
||||||
|
'a f': 231,
|
||||||
|
'a h': 232,
|
||||||
|
'a k': 233,
|
||||||
|
'a u': 234,
|
||||||
|
'afi': 235,
|
||||||
|
'agn': 236,
|
||||||
|
'arn': 237,
|
||||||
|
'ast': 238,
|
||||||
|
'ber': 239,
|
||||||
|
'efu': 240,
|
||||||
|
'enn': 241,
|
||||||
|
'erb': 242,
|
||||||
|
'erg': 243,
|
||||||
|
'fi ': 244,
|
||||||
|
'g a': 245,
|
||||||
|
'gar': 246,
|
||||||
|
'iðs': 247,
|
||||||
|
'ker': 248,
|
||||||
|
'kke': 249,
|
||||||
|
'lan': 250,
|
||||||
|
'ljó': 251,
|
||||||
|
'llt': 252,
|
||||||
|
'ma ': 253,
|
||||||
|
'mið': 254,
|
||||||
|
'n v': 255,
|
||||||
|
'n í': 256,
|
||||||
|
'nan': 257,
|
||||||
|
'nda': 258,
|
||||||
|
'ndu': 259,
|
||||||
|
'nið': 260,
|
||||||
|
'nna': 261,
|
||||||
|
'nnu': 262,
|
||||||
|
'nu ': 263,
|
||||||
|
'r o': 264,
|
||||||
|
'rbe': 265,
|
||||||
|
'rgi': 266,
|
||||||
|
'slö': 267,
|
||||||
|
'sé ': 268,
|
||||||
|
't a': 269,
|
||||||
|
't h': 270,
|
||||||
|
'til': 271,
|
||||||
|
'tin': 272,
|
||||||
|
'ugu': 273,
|
||||||
|
'vil': 274,
|
||||||
|
'ygg': 275,
|
||||||
|
'á s': 276,
|
||||||
|
'ð a': 277,
|
||||||
|
'ð b': 278,
|
||||||
|
'órn': 279,
|
||||||
|
'ögn': 280,
|
||||||
|
'öku': 281,
|
||||||
|
' at': 282,
|
||||||
|
' fi': 283,
|
||||||
|
' fé': 284,
|
||||||
|
' ka': 285,
|
||||||
|
' ma': 286,
|
||||||
|
' no': 287,
|
||||||
|
' sa': 288,
|
||||||
|
' si': 289,
|
||||||
|
' ti': 290,
|
||||||
|
' ák': 291,
|
||||||
|
'a m': 292,
|
||||||
|
'a t': 293,
|
||||||
|
'a í': 294,
|
||||||
|
'a þ': 295,
|
||||||
|
'afa': 296,
|
||||||
|
'afs': 297,
|
||||||
|
'ald': 298,
|
||||||
|
'arf': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/it.py
Normal file
303
libs/guess_language/data/models/it.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
' di': 0,
|
||||||
|
'to ': 1,
|
||||||
|
'la ': 2,
|
||||||
|
' de': 3,
|
||||||
|
'di ': 4,
|
||||||
|
'no ': 5,
|
||||||
|
' co': 6,
|
||||||
|
're ': 7,
|
||||||
|
'ion': 8,
|
||||||
|
'e d': 9,
|
||||||
|
' e ': 10,
|
||||||
|
'le ': 11,
|
||||||
|
'del': 12,
|
||||||
|
'ne ': 13,
|
||||||
|
'ti ': 14,
|
||||||
|
'ell': 15,
|
||||||
|
' la': 16,
|
||||||
|
' un': 17,
|
||||||
|
'ni ': 18,
|
||||||
|
'i d': 19,
|
||||||
|
'per': 20,
|
||||||
|
' pe': 21,
|
||||||
|
'ent': 22,
|
||||||
|
' in': 23,
|
||||||
|
'one': 24,
|
||||||
|
'he ': 25,
|
||||||
|
'ta ': 26,
|
||||||
|
'zio': 27,
|
||||||
|
'che': 28,
|
||||||
|
'o d': 29,
|
||||||
|
'a d': 30,
|
||||||
|
'na ': 31,
|
||||||
|
'ato': 32,
|
||||||
|
'e s': 33,
|
||||||
|
' so': 34,
|
||||||
|
'i s': 35,
|
||||||
|
'lla': 36,
|
||||||
|
'a p': 37,
|
||||||
|
'li ': 38,
|
||||||
|
'te ': 39,
|
||||||
|
' al': 40,
|
||||||
|
' ch': 41,
|
||||||
|
'er ': 42,
|
||||||
|
' pa': 43,
|
||||||
|
' si': 44,
|
||||||
|
'con': 45,
|
||||||
|
'sta': 46,
|
||||||
|
' pr': 47,
|
||||||
|
'a c': 48,
|
||||||
|
' se': 49,
|
||||||
|
'el ': 50,
|
||||||
|
'ia ': 51,
|
||||||
|
'si ': 52,
|
||||||
|
'e p': 53,
|
||||||
|
' da': 54,
|
||||||
|
'e i': 55,
|
||||||
|
'i p': 56,
|
||||||
|
'ont': 57,
|
||||||
|
'ano': 58,
|
||||||
|
'i c': 59,
|
||||||
|
'all': 60,
|
||||||
|
'azi': 61,
|
||||||
|
'nte': 62,
|
||||||
|
'on ': 63,
|
||||||
|
'nti': 64,
|
||||||
|
'o s': 65,
|
||||||
|
' ri': 66,
|
||||||
|
'i a': 67,
|
||||||
|
'o a': 68,
|
||||||
|
'un ': 69,
|
||||||
|
' an': 70,
|
||||||
|
'are': 71,
|
||||||
|
'ari': 72,
|
||||||
|
'e a': 73,
|
||||||
|
'i e': 74,
|
||||||
|
'ita': 75,
|
||||||
|
'men': 76,
|
||||||
|
'ri ': 77,
|
||||||
|
' ca': 78,
|
||||||
|
' il': 79,
|
||||||
|
' no': 80,
|
||||||
|
' po': 81,
|
||||||
|
'a s': 82,
|
||||||
|
'ant': 83,
|
||||||
|
'il ': 84,
|
||||||
|
'in ': 85,
|
||||||
|
'a l': 86,
|
||||||
|
'ati': 87,
|
||||||
|
'cia': 88,
|
||||||
|
'e c': 89,
|
||||||
|
'ro ': 90,
|
||||||
|
'ann': 91,
|
||||||
|
'est': 92,
|
||||||
|
'gli': 93,
|
||||||
|
'tà ': 94,
|
||||||
|
' qu': 95,
|
||||||
|
'e l': 96,
|
||||||
|
'nta': 97,
|
||||||
|
' a ': 98,
|
||||||
|
'com': 99,
|
||||||
|
'o c': 100,
|
||||||
|
'ra ': 101,
|
||||||
|
' le': 102,
|
||||||
|
' ne': 103,
|
||||||
|
'ali': 104,
|
||||||
|
'ere': 105,
|
||||||
|
'ist': 106,
|
||||||
|
' ma': 107,
|
||||||
|
' è ': 108,
|
||||||
|
'io ': 109,
|
||||||
|
'lle': 110,
|
||||||
|
'me ': 111,
|
||||||
|
'era': 112,
|
||||||
|
'ica': 113,
|
||||||
|
'ost': 114,
|
||||||
|
'pro': 115,
|
||||||
|
'tar': 116,
|
||||||
|
'una': 117,
|
||||||
|
' pi': 118,
|
||||||
|
'da ': 119,
|
||||||
|
'tat': 120,
|
||||||
|
' mi': 121,
|
||||||
|
'att': 122,
|
||||||
|
'ca ': 123,
|
||||||
|
'mo ': 124,
|
||||||
|
'non': 125,
|
||||||
|
'par': 126,
|
||||||
|
'sti': 127,
|
||||||
|
' fa': 128,
|
||||||
|
' i ': 129,
|
||||||
|
' re': 130,
|
||||||
|
' su': 131,
|
||||||
|
'ess': 132,
|
||||||
|
'ini': 133,
|
||||||
|
'nto': 134,
|
||||||
|
'o l': 135,
|
||||||
|
'ssi': 136,
|
||||||
|
'tto': 137,
|
||||||
|
'a e': 138,
|
||||||
|
'ame': 139,
|
||||||
|
'col': 140,
|
||||||
|
'ei ': 141,
|
||||||
|
'ma ': 142,
|
||||||
|
'o i': 143,
|
||||||
|
'za ': 144,
|
||||||
|
' st': 145,
|
||||||
|
'a a': 146,
|
||||||
|
'ale': 147,
|
||||||
|
'anc': 148,
|
||||||
|
'ani': 149,
|
||||||
|
'i m': 150,
|
||||||
|
'ian': 151,
|
||||||
|
'o p': 152,
|
||||||
|
'oni': 153,
|
||||||
|
'sio': 154,
|
||||||
|
'tan': 155,
|
||||||
|
'tti': 156,
|
||||||
|
' lo': 157,
|
||||||
|
'i r': 158,
|
||||||
|
'oci': 159,
|
||||||
|
'oli': 160,
|
||||||
|
'ona': 161,
|
||||||
|
'ono': 162,
|
||||||
|
'tra': 163,
|
||||||
|
' l ': 164,
|
||||||
|
'a r': 165,
|
||||||
|
'eri': 166,
|
||||||
|
'ett': 167,
|
||||||
|
'lo ': 168,
|
||||||
|
'nza': 169,
|
||||||
|
'que': 170,
|
||||||
|
'str': 171,
|
||||||
|
'ter': 172,
|
||||||
|
'tta': 173,
|
||||||
|
' ba': 174,
|
||||||
|
' li': 175,
|
||||||
|
' te': 176,
|
||||||
|
'ass': 177,
|
||||||
|
'e f': 178,
|
||||||
|
'enz': 179,
|
||||||
|
'for': 180,
|
||||||
|
'nno': 181,
|
||||||
|
'olo': 182,
|
||||||
|
'ori': 183,
|
||||||
|
'res': 184,
|
||||||
|
'tor': 185,
|
||||||
|
' ci': 186,
|
||||||
|
' vo': 187,
|
||||||
|
'a i': 188,
|
||||||
|
'al ': 189,
|
||||||
|
'chi': 190,
|
||||||
|
'e n': 191,
|
||||||
|
'lia': 192,
|
||||||
|
'pre': 193,
|
||||||
|
'ria': 194,
|
||||||
|
'uni': 195,
|
||||||
|
'ver': 196,
|
||||||
|
' sp': 197,
|
||||||
|
'imo': 198,
|
||||||
|
'l a': 199,
|
||||||
|
'l c': 200,
|
||||||
|
'ran': 201,
|
||||||
|
'sen': 202,
|
||||||
|
'soc': 203,
|
||||||
|
'tic': 204,
|
||||||
|
' fi': 205,
|
||||||
|
' mo': 206,
|
||||||
|
'a n': 207,
|
||||||
|
'ce ': 208,
|
||||||
|
'dei': 209,
|
||||||
|
'ggi': 210,
|
||||||
|
'gio': 211,
|
||||||
|
'iti': 212,
|
||||||
|
'l s': 213,
|
||||||
|
'lit': 214,
|
||||||
|
'll ': 215,
|
||||||
|
'mon': 216,
|
||||||
|
'ola': 217,
|
||||||
|
'pac': 218,
|
||||||
|
'sim': 219,
|
||||||
|
'tit': 220,
|
||||||
|
'utt': 221,
|
||||||
|
'vol': 222,
|
||||||
|
' ar': 223,
|
||||||
|
' fo': 224,
|
||||||
|
' ha': 225,
|
||||||
|
' sa': 226,
|
||||||
|
'acc': 227,
|
||||||
|
'e r': 228,
|
||||||
|
'ire': 229,
|
||||||
|
'man': 230,
|
||||||
|
'ntr': 231,
|
||||||
|
'rat': 232,
|
||||||
|
'sco': 233,
|
||||||
|
'tro': 234,
|
||||||
|
'tut': 235,
|
||||||
|
'va ': 236,
|
||||||
|
' do': 237,
|
||||||
|
' gi': 238,
|
||||||
|
' me': 239,
|
||||||
|
' sc': 240,
|
||||||
|
' tu': 241,
|
||||||
|
' ve': 242,
|
||||||
|
' vi': 243,
|
||||||
|
'a m': 244,
|
||||||
|
'ber': 245,
|
||||||
|
'can': 246,
|
||||||
|
'cit': 247,
|
||||||
|
'i l': 248,
|
||||||
|
'ier': 249,
|
||||||
|
'ità': 250,
|
||||||
|
'lli': 251,
|
||||||
|
'min': 252,
|
||||||
|
'n p': 253,
|
||||||
|
'nat': 254,
|
||||||
|
'nda': 255,
|
||||||
|
'o e': 256,
|
||||||
|
'o f': 257,
|
||||||
|
'o u': 258,
|
||||||
|
'ore': 259,
|
||||||
|
'oro': 260,
|
||||||
|
'ort': 261,
|
||||||
|
'sto': 262,
|
||||||
|
'ten': 263,
|
||||||
|
'tiv': 264,
|
||||||
|
'van': 265,
|
||||||
|
'art': 266,
|
||||||
|
'cco': 267,
|
||||||
|
'ci ': 268,
|
||||||
|
'cos': 269,
|
||||||
|
'dal': 270,
|
||||||
|
'e v': 271,
|
||||||
|
'i i': 272,
|
||||||
|
'ila': 273,
|
||||||
|
'ino': 274,
|
||||||
|
'l p': 275,
|
||||||
|
'n c': 276,
|
||||||
|
'nit': 277,
|
||||||
|
'ole': 278,
|
||||||
|
'ome': 279,
|
||||||
|
'po ': 280,
|
||||||
|
'rio': 281,
|
||||||
|
'sa ': 282,
|
||||||
|
' ce': 283,
|
||||||
|
' es': 284,
|
||||||
|
' tr': 285,
|
||||||
|
'a b': 286,
|
||||||
|
'and': 287,
|
||||||
|
'ata': 288,
|
||||||
|
'der': 289,
|
||||||
|
'ens': 290,
|
||||||
|
'ers': 291,
|
||||||
|
'gi ': 292,
|
||||||
|
'ial': 293,
|
||||||
|
'ina': 294,
|
||||||
|
'itt': 295,
|
||||||
|
'izi': 296,
|
||||||
|
'lan': 297,
|
||||||
|
'lor': 298,
|
||||||
|
'mil': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/kk.py
Normal file
303
libs/guess_language/data/models/kk.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'ан ': 0,
|
||||||
|
'ен ': 1,
|
||||||
|
'ың ': 2,
|
||||||
|
' қа': 3,
|
||||||
|
' ба': 4,
|
||||||
|
'ай ': 5,
|
||||||
|
'нда': 6,
|
||||||
|
'ын ': 7,
|
||||||
|
' са': 8,
|
||||||
|
' ал': 9,
|
||||||
|
'ді ': 10,
|
||||||
|
'ары': 11,
|
||||||
|
'ды ': 12,
|
||||||
|
'ып ': 13,
|
||||||
|
' мұ': 14,
|
||||||
|
' бі': 15,
|
||||||
|
'асы': 16,
|
||||||
|
'да ': 17,
|
||||||
|
'най': 18,
|
||||||
|
' жа': 19,
|
||||||
|
'мұн': 20,
|
||||||
|
'ста': 21,
|
||||||
|
'ған': 22,
|
||||||
|
'н б': 23,
|
||||||
|
'ұна': 24,
|
||||||
|
' бо': 25,
|
||||||
|
'ның': 26,
|
||||||
|
'ін ': 27,
|
||||||
|
'лар': 28,
|
||||||
|
'сын': 29,
|
||||||
|
' де': 30,
|
||||||
|
'аға': 31,
|
||||||
|
'тан': 32,
|
||||||
|
' кө': 33,
|
||||||
|
'бір': 34,
|
||||||
|
'ер ': 35,
|
||||||
|
'мен': 36,
|
||||||
|
'аза': 37,
|
||||||
|
'ынд': 38,
|
||||||
|
'ыны': 39,
|
||||||
|
' ме': 40,
|
||||||
|
'анд': 41,
|
||||||
|
'ері': 42,
|
||||||
|
'бол': 43,
|
||||||
|
'дың': 44,
|
||||||
|
'қаз': 45,
|
||||||
|
'аты': 46,
|
||||||
|
'сы ': 47,
|
||||||
|
'тын': 48,
|
||||||
|
'ғы ': 49,
|
||||||
|
' ке': 50,
|
||||||
|
'ар ': 51,
|
||||||
|
'зақ': 52,
|
||||||
|
'ық ': 53,
|
||||||
|
'ала': 54,
|
||||||
|
'алы': 55,
|
||||||
|
'аны': 56,
|
||||||
|
'ара': 57,
|
||||||
|
'ағы': 58,
|
||||||
|
'ген': 59,
|
||||||
|
'тар': 60,
|
||||||
|
'тер': 61,
|
||||||
|
'тыр': 62,
|
||||||
|
'айд': 63,
|
||||||
|
'ард': 64,
|
||||||
|
'де ': 65,
|
||||||
|
'ға ': 66,
|
||||||
|
' қо': 67,
|
||||||
|
'бар': 68,
|
||||||
|
'ің ': 69,
|
||||||
|
'қан': 70,
|
||||||
|
' бе': 71,
|
||||||
|
' қы': 72,
|
||||||
|
'ақс': 73,
|
||||||
|
'гер': 74,
|
||||||
|
'дан': 75,
|
||||||
|
'дар': 76,
|
||||||
|
'лық': 77,
|
||||||
|
'лға': 78,
|
||||||
|
'ына': 79,
|
||||||
|
'ір ': 80,
|
||||||
|
'ірі': 81,
|
||||||
|
'ғас': 82,
|
||||||
|
' та': 83,
|
||||||
|
'а б': 84,
|
||||||
|
'гі ': 85,
|
||||||
|
'еді': 86,
|
||||||
|
'еле': 87,
|
||||||
|
'йды': 88,
|
||||||
|
'н к': 89,
|
||||||
|
'н т': 90,
|
||||||
|
'ола': 91,
|
||||||
|
'рын': 92,
|
||||||
|
'іп ': 93,
|
||||||
|
'қст': 94,
|
||||||
|
'қта': 95,
|
||||||
|
'ң б': 96,
|
||||||
|
' ай': 97,
|
||||||
|
' ол': 98,
|
||||||
|
' со': 99,
|
||||||
|
'айт': 100,
|
||||||
|
'дағ': 101,
|
||||||
|
'иге': 102,
|
||||||
|
'лер': 103,
|
||||||
|
'лып': 104,
|
||||||
|
'н а': 105,
|
||||||
|
'ік ': 106,
|
||||||
|
'ақт': 107,
|
||||||
|
'бағ': 108,
|
||||||
|
'кен': 109,
|
||||||
|
'н қ': 110,
|
||||||
|
'ны ': 111,
|
||||||
|
'рге': 112,
|
||||||
|
'рға': 113,
|
||||||
|
'ыр ': 114,
|
||||||
|
' ар': 115,
|
||||||
|
'алғ': 116,
|
||||||
|
'аса': 117,
|
||||||
|
'бас': 118,
|
||||||
|
'бер': 119,
|
||||||
|
'ге ': 120,
|
||||||
|
'еті': 121,
|
||||||
|
'на ': 122,
|
||||||
|
'нде': 123,
|
||||||
|
'не ': 124,
|
||||||
|
'ниг': 125,
|
||||||
|
'рды': 126,
|
||||||
|
'ры ': 127,
|
||||||
|
'сай': 128,
|
||||||
|
' ау': 129,
|
||||||
|
' кү': 130,
|
||||||
|
' ни': 131,
|
||||||
|
' от': 132,
|
||||||
|
' өз': 133,
|
||||||
|
'ауд': 134,
|
||||||
|
'еп ': 135,
|
||||||
|
'иял': 136,
|
||||||
|
'лты': 137,
|
||||||
|
'н ж': 138,
|
||||||
|
'н о': 139,
|
||||||
|
'осы': 140,
|
||||||
|
'оты': 141,
|
||||||
|
'рып': 142,
|
||||||
|
'рі ': 143,
|
||||||
|
'тке': 144,
|
||||||
|
'ты ': 145,
|
||||||
|
'ы б': 146,
|
||||||
|
'ы ж': 147,
|
||||||
|
'ылы': 148,
|
||||||
|
'ысы': 149,
|
||||||
|
'і с': 150,
|
||||||
|
'қар': 151,
|
||||||
|
' бұ': 152,
|
||||||
|
' да': 153,
|
||||||
|
' же': 154,
|
||||||
|
' тұ': 155,
|
||||||
|
' құ': 156,
|
||||||
|
'ады': 157,
|
||||||
|
'айл': 158,
|
||||||
|
'ап ': 159,
|
||||||
|
'ата': 160,
|
||||||
|
'ені': 161,
|
||||||
|
'йла': 162,
|
||||||
|
'н м': 163,
|
||||||
|
'н с': 164,
|
||||||
|
'нды': 165,
|
||||||
|
'нді': 166,
|
||||||
|
'р м': 167,
|
||||||
|
'тай': 168,
|
||||||
|
'тін': 169,
|
||||||
|
'ы т': 170,
|
||||||
|
'ыс ': 171,
|
||||||
|
'інд': 172,
|
||||||
|
' би': 173,
|
||||||
|
'а ж': 174,
|
||||||
|
'ауы': 175,
|
||||||
|
'деп': 176,
|
||||||
|
'дің': 177,
|
||||||
|
'еке': 178,
|
||||||
|
'ери': 179,
|
||||||
|
'йын': 180,
|
||||||
|
'кел': 181,
|
||||||
|
'лды': 182,
|
||||||
|
'ма ': 183,
|
||||||
|
'нан': 184,
|
||||||
|
'оны': 185,
|
||||||
|
'п ж': 186,
|
||||||
|
'п о': 187,
|
||||||
|
'р б': 188,
|
||||||
|
'рия': 189,
|
||||||
|
'рла': 190,
|
||||||
|
'уда': 191,
|
||||||
|
'шыл': 192,
|
||||||
|
'ы а': 193,
|
||||||
|
'ықт': 194,
|
||||||
|
'і а': 195,
|
||||||
|
'і б': 196,
|
||||||
|
'із ': 197,
|
||||||
|
'ілі': 198,
|
||||||
|
'ң қ': 199,
|
||||||
|
' ас': 200,
|
||||||
|
' ек': 201,
|
||||||
|
' жо': 202,
|
||||||
|
' мә': 203,
|
||||||
|
' ос': 204,
|
||||||
|
' ре': 205,
|
||||||
|
' се': 206,
|
||||||
|
'алд': 207,
|
||||||
|
'дал': 208,
|
||||||
|
'дег': 209,
|
||||||
|
'дей': 210,
|
||||||
|
'е б': 211,
|
||||||
|
'ет ': 212,
|
||||||
|
'жас': 213,
|
||||||
|
'й б': 214,
|
||||||
|
'лау': 215,
|
||||||
|
'лда': 216,
|
||||||
|
'мет': 217,
|
||||||
|
'нын': 218,
|
||||||
|
'сар': 219,
|
||||||
|
'сі ': 220,
|
||||||
|
'ті ': 221,
|
||||||
|
'ыры': 222,
|
||||||
|
'ыта': 223,
|
||||||
|
'ісі': 224,
|
||||||
|
'ң а': 225,
|
||||||
|
'өте': 226,
|
||||||
|
' ат': 227,
|
||||||
|
' ел': 228,
|
||||||
|
' жү': 229,
|
||||||
|
' ма': 230,
|
||||||
|
' то': 231,
|
||||||
|
' шы': 232,
|
||||||
|
'а а': 233,
|
||||||
|
'алт': 234,
|
||||||
|
'ама': 235,
|
||||||
|
'арл': 236,
|
||||||
|
'аст': 237,
|
||||||
|
'бұл': 238,
|
||||||
|
'дай': 239,
|
||||||
|
'дық': 240,
|
||||||
|
'ек ': 241,
|
||||||
|
'ель': 242,
|
||||||
|
'есі': 243,
|
||||||
|
'зді': 244,
|
||||||
|
'көт': 245,
|
||||||
|
'лем': 246,
|
||||||
|
'ль ': 247,
|
||||||
|
'н е': 248,
|
||||||
|
'п а': 249,
|
||||||
|
'р а': 250,
|
||||||
|
'рес': 251,
|
||||||
|
'са ': 252,
|
||||||
|
'та ': 253,
|
||||||
|
'тте': 254,
|
||||||
|
'тұр': 255,
|
||||||
|
'шы ': 256,
|
||||||
|
'ы д': 257,
|
||||||
|
'ы қ': 258,
|
||||||
|
'ыз ': 259,
|
||||||
|
'қыт': 260,
|
||||||
|
' ко': 261,
|
||||||
|
' не': 262,
|
||||||
|
' ой': 263,
|
||||||
|
' ор': 264,
|
||||||
|
' сұ': 265,
|
||||||
|
' тү': 266,
|
||||||
|
'аль': 267,
|
||||||
|
'аре': 268,
|
||||||
|
'атт': 269,
|
||||||
|
'дір': 270,
|
||||||
|
'ев ': 271,
|
||||||
|
'егі': 272,
|
||||||
|
'еда': 273,
|
||||||
|
'екі': 274,
|
||||||
|
'елд': 275,
|
||||||
|
'ерг': 276,
|
||||||
|
'ерд': 277,
|
||||||
|
'ияд': 278,
|
||||||
|
'кер': 279,
|
||||||
|
'кет': 280,
|
||||||
|
'лыс': 281,
|
||||||
|
'ліс': 282,
|
||||||
|
'мед': 283,
|
||||||
|
'мпи': 284,
|
||||||
|
'н д': 285,
|
||||||
|
'ні ': 286,
|
||||||
|
'нін': 287,
|
||||||
|
'п т': 288,
|
||||||
|
'пек': 289,
|
||||||
|
'рел': 290,
|
||||||
|
'рта': 291,
|
||||||
|
'ріл': 292,
|
||||||
|
'рін': 293,
|
||||||
|
'сен': 294,
|
||||||
|
'тал': 295,
|
||||||
|
'шіл': 296,
|
||||||
|
'ы к': 297,
|
||||||
|
'ы м': 298,
|
||||||
|
'ыст': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/ky.py
Normal file
303
libs/guess_language/data/models/ky.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'ын ': 0,
|
||||||
|
'ан ': 1,
|
||||||
|
' жа': 2,
|
||||||
|
'ен ': 3,
|
||||||
|
'да ': 4,
|
||||||
|
' та': 5,
|
||||||
|
'ар ': 6,
|
||||||
|
'ин ': 7,
|
||||||
|
' ка': 8,
|
||||||
|
'ары': 9,
|
||||||
|
' ал': 10,
|
||||||
|
' ба': 11,
|
||||||
|
' би': 12,
|
||||||
|
'лар': 13,
|
||||||
|
' бо': 14,
|
||||||
|
' кы': 15,
|
||||||
|
'ала': 16,
|
||||||
|
'н к': 17,
|
||||||
|
' са': 18,
|
||||||
|
'нда': 19,
|
||||||
|
'ган': 20,
|
||||||
|
'тар': 21,
|
||||||
|
' де': 22,
|
||||||
|
'анд': 23,
|
||||||
|
'н б': 24,
|
||||||
|
' ке': 25,
|
||||||
|
'ард': 26,
|
||||||
|
'мен': 27,
|
||||||
|
'н т': 28,
|
||||||
|
'ара': 29,
|
||||||
|
'нын': 30,
|
||||||
|
' да': 31,
|
||||||
|
' ме': 32,
|
||||||
|
'кыр': 33,
|
||||||
|
' че': 34,
|
||||||
|
'н а': 35,
|
||||||
|
'ры ': 36,
|
||||||
|
' ко': 37,
|
||||||
|
'ген': 38,
|
||||||
|
'дар': 39,
|
||||||
|
'кен': 40,
|
||||||
|
'кта': 41,
|
||||||
|
'уу ': 42,
|
||||||
|
'ене': 43,
|
||||||
|
'ери': 44,
|
||||||
|
' ша': 45,
|
||||||
|
'алы': 46,
|
||||||
|
'ат ': 47,
|
||||||
|
'на ': 48,
|
||||||
|
' кө': 49,
|
||||||
|
' эм': 50,
|
||||||
|
'аты': 51,
|
||||||
|
'дан': 52,
|
||||||
|
'деп': 53,
|
||||||
|
'дын': 54,
|
||||||
|
'еп ': 55,
|
||||||
|
'нен': 56,
|
||||||
|
'рын': 57,
|
||||||
|
' бе': 58,
|
||||||
|
'кан': 59,
|
||||||
|
'луу': 60,
|
||||||
|
'ргы': 61,
|
||||||
|
'тан': 62,
|
||||||
|
'шай': 63,
|
||||||
|
'ырг': 64,
|
||||||
|
'үн ': 65,
|
||||||
|
' ар': 66,
|
||||||
|
' ма': 67,
|
||||||
|
'агы': 68,
|
||||||
|
'акт': 69,
|
||||||
|
'аны': 70,
|
||||||
|
'гы ': 71,
|
||||||
|
'гыз': 72,
|
||||||
|
'ды ': 73,
|
||||||
|
'рда': 74,
|
||||||
|
'ай ': 75,
|
||||||
|
'бир': 76,
|
||||||
|
'бол': 77,
|
||||||
|
'ер ': 78,
|
||||||
|
'н с': 79,
|
||||||
|
'нды': 80,
|
||||||
|
'ун ': 81,
|
||||||
|
'ча ': 82,
|
||||||
|
'ынд': 83,
|
||||||
|
'а к': 84,
|
||||||
|
'ага': 85,
|
||||||
|
'айл': 86,
|
||||||
|
'ана': 87,
|
||||||
|
'ап ': 88,
|
||||||
|
'га ': 89,
|
||||||
|
'лге': 90,
|
||||||
|
'нча': 91,
|
||||||
|
'п к': 92,
|
||||||
|
'рды': 93,
|
||||||
|
'туу': 94,
|
||||||
|
'ыны': 95,
|
||||||
|
' ан': 96,
|
||||||
|
' өз': 97,
|
||||||
|
'ама': 98,
|
||||||
|
'ата': 99,
|
||||||
|
'дин': 100,
|
||||||
|
'йт ': 101,
|
||||||
|
'лга': 102,
|
||||||
|
'лоо': 103,
|
||||||
|
'оо ': 104,
|
||||||
|
'ри ': 105,
|
||||||
|
'тин': 106,
|
||||||
|
'ыз ': 107,
|
||||||
|
'ып ': 108,
|
||||||
|
'өрү': 109,
|
||||||
|
' па': 110,
|
||||||
|
' эк': 111,
|
||||||
|
'а б': 112,
|
||||||
|
'алг': 113,
|
||||||
|
'асы': 114,
|
||||||
|
'ашт': 115,
|
||||||
|
'биз': 116,
|
||||||
|
'кел': 117,
|
||||||
|
'кте': 118,
|
||||||
|
'тал': 119,
|
||||||
|
' не': 120,
|
||||||
|
' су': 121,
|
||||||
|
'акы': 122,
|
||||||
|
'ент': 123,
|
||||||
|
'инд': 124,
|
||||||
|
'ир ': 125,
|
||||||
|
'кал': 126,
|
||||||
|
'н д': 127,
|
||||||
|
'нде': 128,
|
||||||
|
'ого': 129,
|
||||||
|
'онд': 130,
|
||||||
|
'оюн': 131,
|
||||||
|
'р б': 132,
|
||||||
|
'р м': 133,
|
||||||
|
'ран': 134,
|
||||||
|
'сал': 135,
|
||||||
|
'ста': 136,
|
||||||
|
'сы ': 137,
|
||||||
|
'ура': 138,
|
||||||
|
'ыгы': 139,
|
||||||
|
' аш': 140,
|
||||||
|
' ми': 141,
|
||||||
|
' сы': 142,
|
||||||
|
' ту': 143,
|
||||||
|
'ал ': 144,
|
||||||
|
'арт': 145,
|
||||||
|
'бор': 146,
|
||||||
|
'елг': 147,
|
||||||
|
'ени': 148,
|
||||||
|
'ет ': 149,
|
||||||
|
'жат': 150,
|
||||||
|
'йло': 151,
|
||||||
|
'кар': 152,
|
||||||
|
'н м': 153,
|
||||||
|
'огу': 154,
|
||||||
|
'п а': 155,
|
||||||
|
'п ж': 156,
|
||||||
|
'р э': 157,
|
||||||
|
'сын': 158,
|
||||||
|
'ык ': 159,
|
||||||
|
'юнч': 160,
|
||||||
|
' бу': 161,
|
||||||
|
' ур': 162,
|
||||||
|
'а а': 163,
|
||||||
|
'ак ': 164,
|
||||||
|
'алд': 165,
|
||||||
|
'алу': 166,
|
||||||
|
'бар': 167,
|
||||||
|
'бер': 168,
|
||||||
|
'бою': 169,
|
||||||
|
'ге ': 170,
|
||||||
|
'дон': 171,
|
||||||
|
'еги': 172,
|
||||||
|
'ект': 173,
|
||||||
|
'ефт': 174,
|
||||||
|
'из ': 175,
|
||||||
|
'кат': 176,
|
||||||
|
'лды': 177,
|
||||||
|
'н ч': 178,
|
||||||
|
'н э': 179,
|
||||||
|
'н ө': 180,
|
||||||
|
'ндо': 181,
|
||||||
|
'неф': 182,
|
||||||
|
'он ': 183,
|
||||||
|
'сат': 184,
|
||||||
|
'тор': 185,
|
||||||
|
'ты ': 186,
|
||||||
|
'уда': 187,
|
||||||
|
'ул ': 188,
|
||||||
|
'ула': 189,
|
||||||
|
'ууд': 190,
|
||||||
|
'ы б': 191,
|
||||||
|
'ы ж': 192,
|
||||||
|
'ы к': 193,
|
||||||
|
'ыл ': 194,
|
||||||
|
'ына': 195,
|
||||||
|
'эке': 196,
|
||||||
|
'ясы': 197,
|
||||||
|
' ат': 198,
|
||||||
|
' до': 199,
|
||||||
|
' жы': 200,
|
||||||
|
' со': 201,
|
||||||
|
' чы': 202,
|
||||||
|
'аас': 203,
|
||||||
|
'айт': 204,
|
||||||
|
'аст': 205,
|
||||||
|
'баа': 206,
|
||||||
|
'баш': 207,
|
||||||
|
'гар': 208,
|
||||||
|
'гын': 209,
|
||||||
|
'дө ': 210,
|
||||||
|
'е б': 211,
|
||||||
|
'ек ': 212,
|
||||||
|
'жыл': 213,
|
||||||
|
'и б': 214,
|
||||||
|
'ик ': 215,
|
||||||
|
'ияс': 216,
|
||||||
|
'кыз': 217,
|
||||||
|
'лда': 218,
|
||||||
|
'лык': 219,
|
||||||
|
'мда': 220,
|
||||||
|
'н ж': 221,
|
||||||
|
'нди': 222,
|
||||||
|
'ни ': 223,
|
||||||
|
'нин': 224,
|
||||||
|
'орд': 225,
|
||||||
|
'рдо': 226,
|
||||||
|
'сто': 227,
|
||||||
|
'та ': 228,
|
||||||
|
'тер': 229,
|
||||||
|
'тти': 230,
|
||||||
|
'тур': 231,
|
||||||
|
'тын': 232,
|
||||||
|
'уп ': 233,
|
||||||
|
'ушу': 234,
|
||||||
|
'фти': 235,
|
||||||
|
'ыкт': 236,
|
||||||
|
'үп ': 237,
|
||||||
|
'өн ': 238,
|
||||||
|
' ай': 239,
|
||||||
|
' бү': 240,
|
||||||
|
' ич': 241,
|
||||||
|
' иш': 242,
|
||||||
|
' мо': 243,
|
||||||
|
' пр': 244,
|
||||||
|
' ре': 245,
|
||||||
|
' өк': 246,
|
||||||
|
' өт': 247,
|
||||||
|
'а д': 248,
|
||||||
|
'а у': 249,
|
||||||
|
'а э': 250,
|
||||||
|
'айм': 251,
|
||||||
|
'амд': 252,
|
||||||
|
'атт': 253,
|
||||||
|
'бек': 254,
|
||||||
|
'бул': 255,
|
||||||
|
'гол': 256,
|
||||||
|
'дег': 257,
|
||||||
|
'еге': 258,
|
||||||
|
'ейт': 259,
|
||||||
|
'еле': 260,
|
||||||
|
'енд': 261,
|
||||||
|
'жак': 262,
|
||||||
|
'и к': 263,
|
||||||
|
'ини': 264,
|
||||||
|
'ири': 265,
|
||||||
|
'йма': 266,
|
||||||
|
'кто': 267,
|
||||||
|
'лик': 268,
|
||||||
|
'мак': 269,
|
||||||
|
'мес': 270,
|
||||||
|
'н у': 271,
|
||||||
|
'н ш': 272,
|
||||||
|
'нтт': 273,
|
||||||
|
'ол ': 274,
|
||||||
|
'оло': 275,
|
||||||
|
'пар': 276,
|
||||||
|
'рак': 277,
|
||||||
|
'рүү': 278,
|
||||||
|
'сыр': 279,
|
||||||
|
'ти ': 280,
|
||||||
|
'тик': 281,
|
||||||
|
'тта': 282,
|
||||||
|
'төр': 283,
|
||||||
|
'у ж': 284,
|
||||||
|
'у с': 285,
|
||||||
|
'шка': 286,
|
||||||
|
'ы м': 287,
|
||||||
|
'ызы': 288,
|
||||||
|
'ылд': 289,
|
||||||
|
'эме': 290,
|
||||||
|
'үрү': 291,
|
||||||
|
'өлү': 292,
|
||||||
|
'өтө': 293,
|
||||||
|
' же': 294,
|
||||||
|
' тү': 295,
|
||||||
|
' эл': 296,
|
||||||
|
' өн': 297,
|
||||||
|
'а ж': 298,
|
||||||
|
'ады': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/la.py
Normal file
303
libs/guess_language/data/models/la.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'um ': 0,
|
||||||
|
'us ': 1,
|
||||||
|
'ut ': 2,
|
||||||
|
'et ': 3,
|
||||||
|
'is ': 4,
|
||||||
|
' et': 5,
|
||||||
|
' in': 6,
|
||||||
|
' qu': 7,
|
||||||
|
'tur': 8,
|
||||||
|
' pr': 9,
|
||||||
|
'est': 10,
|
||||||
|
'tio': 11,
|
||||||
|
' au': 12,
|
||||||
|
'am ': 13,
|
||||||
|
'em ': 14,
|
||||||
|
'aut': 15,
|
||||||
|
' di': 16,
|
||||||
|
'ent': 17,
|
||||||
|
'in ': 18,
|
||||||
|
'dic': 19,
|
||||||
|
't e': 20,
|
||||||
|
' es': 21,
|
||||||
|
'ur ': 22,
|
||||||
|
'ati': 23,
|
||||||
|
'ion': 24,
|
||||||
|
'st ': 25,
|
||||||
|
' ut': 26,
|
||||||
|
'ae ': 27,
|
||||||
|
'qua': 28,
|
||||||
|
' de': 29,
|
||||||
|
'nt ': 30,
|
||||||
|
' su': 31,
|
||||||
|
' si': 32,
|
||||||
|
'itu': 33,
|
||||||
|
'unt': 34,
|
||||||
|
'rum': 35,
|
||||||
|
'ia ': 36,
|
||||||
|
'es ': 37,
|
||||||
|
'ter': 38,
|
||||||
|
' re': 39,
|
||||||
|
'nti': 40,
|
||||||
|
'rae': 41,
|
||||||
|
's e': 42,
|
||||||
|
'qui': 43,
|
||||||
|
'io ': 44,
|
||||||
|
'pro': 45,
|
||||||
|
'it ': 46,
|
||||||
|
'per': 47,
|
||||||
|
'ita': 48,
|
||||||
|
'one': 49,
|
||||||
|
'ici': 50,
|
||||||
|
'ius': 51,
|
||||||
|
' co': 52,
|
||||||
|
't d': 53,
|
||||||
|
'bus': 54,
|
||||||
|
'pra': 55,
|
||||||
|
'm e': 56,
|
||||||
|
' no': 57,
|
||||||
|
'edi': 58,
|
||||||
|
'tia': 59,
|
||||||
|
'ue ': 60,
|
||||||
|
'ibu': 61,
|
||||||
|
' se': 62,
|
||||||
|
' ad': 63,
|
||||||
|
'er ': 64,
|
||||||
|
' fi': 65,
|
||||||
|
'ili': 66,
|
||||||
|
'que': 67,
|
||||||
|
't i': 68,
|
||||||
|
'de ': 69,
|
||||||
|
'oru': 70,
|
||||||
|
' te': 71,
|
||||||
|
'ali': 72,
|
||||||
|
' pe': 73,
|
||||||
|
'aed': 74,
|
||||||
|
'cit': 75,
|
||||||
|
'm d': 76,
|
||||||
|
't s': 77,
|
||||||
|
'tat': 78,
|
||||||
|
'tem': 79,
|
||||||
|
'tis': 80,
|
||||||
|
't p': 81,
|
||||||
|
'sti': 82,
|
||||||
|
'te ': 83,
|
||||||
|
'cum': 84,
|
||||||
|
'ere': 85,
|
||||||
|
'ium': 86,
|
||||||
|
' ex': 87,
|
||||||
|
'rat': 88,
|
||||||
|
'ta ': 89,
|
||||||
|
'con': 90,
|
||||||
|
'cti': 91,
|
||||||
|
'oni': 92,
|
||||||
|
'ra ': 93,
|
||||||
|
's i': 94,
|
||||||
|
' cu': 95,
|
||||||
|
' sa': 96,
|
||||||
|
'eni': 97,
|
||||||
|
'nis': 98,
|
||||||
|
'nte': 99,
|
||||||
|
'eri': 100,
|
||||||
|
'omi': 101,
|
||||||
|
're ': 102,
|
||||||
|
's a': 103,
|
||||||
|
'min': 104,
|
||||||
|
'os ': 105,
|
||||||
|
'ti ': 106,
|
||||||
|
'uer': 107,
|
||||||
|
' ma': 108,
|
||||||
|
' ue': 109,
|
||||||
|
'm s': 110,
|
||||||
|
'nem': 111,
|
||||||
|
't m': 112,
|
||||||
|
' mo': 113,
|
||||||
|
' po': 114,
|
||||||
|
' ui': 115,
|
||||||
|
'gen': 116,
|
||||||
|
'ict': 117,
|
||||||
|
'm i': 118,
|
||||||
|
'ris': 119,
|
||||||
|
's s': 120,
|
||||||
|
't a': 121,
|
||||||
|
'uae': 122,
|
||||||
|
' do': 123,
|
||||||
|
'm a': 124,
|
||||||
|
't c': 125,
|
||||||
|
' ge': 126,
|
||||||
|
'as ': 127,
|
||||||
|
'e i': 128,
|
||||||
|
'e p': 129,
|
||||||
|
'ne ': 130,
|
||||||
|
' ca': 131,
|
||||||
|
'ine': 132,
|
||||||
|
'quo': 133,
|
||||||
|
's p': 134,
|
||||||
|
' al': 135,
|
||||||
|
'e e': 136,
|
||||||
|
'ntu': 137,
|
||||||
|
'ro ': 138,
|
||||||
|
'tri': 139,
|
||||||
|
'tus': 140,
|
||||||
|
'uit': 141,
|
||||||
|
'atu': 142,
|
||||||
|
'ini': 143,
|
||||||
|
'iqu': 144,
|
||||||
|
'm p': 145,
|
||||||
|
'ost': 146,
|
||||||
|
'res': 147,
|
||||||
|
'ura': 148,
|
||||||
|
' ac': 149,
|
||||||
|
' fu': 150,
|
||||||
|
'a e': 151,
|
||||||
|
'ant': 152,
|
||||||
|
'nes': 153,
|
||||||
|
'nim': 154,
|
||||||
|
'sun': 155,
|
||||||
|
'tra': 156,
|
||||||
|
'e a': 157,
|
||||||
|
's d': 158,
|
||||||
|
' pa': 159,
|
||||||
|
' uo': 160,
|
||||||
|
'ecu': 161,
|
||||||
|
' om': 162,
|
||||||
|
' tu': 163,
|
||||||
|
'ad ': 164,
|
||||||
|
'cut': 165,
|
||||||
|
'omn': 166,
|
||||||
|
's q': 167,
|
||||||
|
' ei': 168,
|
||||||
|
'ex ': 169,
|
||||||
|
'icu': 170,
|
||||||
|
'tor': 171,
|
||||||
|
'uid': 172,
|
||||||
|
' ip': 173,
|
||||||
|
' me': 174,
|
||||||
|
'e s': 175,
|
||||||
|
'era': 176,
|
||||||
|
'eru': 177,
|
||||||
|
'iam': 178,
|
||||||
|
'ide': 179,
|
||||||
|
'ips': 180,
|
||||||
|
' iu': 181,
|
||||||
|
'a s': 182,
|
||||||
|
'do ': 183,
|
||||||
|
'e d': 184,
|
||||||
|
'eiu': 185,
|
||||||
|
'ica': 186,
|
||||||
|
'im ': 187,
|
||||||
|
'm c': 188,
|
||||||
|
'm u': 189,
|
||||||
|
'tiu': 190,
|
||||||
|
' ho': 191,
|
||||||
|
'cat': 192,
|
||||||
|
'ist': 193,
|
||||||
|
'nat': 194,
|
||||||
|
'on ': 195,
|
||||||
|
'pti': 196,
|
||||||
|
'reg': 197,
|
||||||
|
'rit': 198,
|
||||||
|
's t': 199,
|
||||||
|
'sic': 200,
|
||||||
|
'spe': 201,
|
||||||
|
' en': 202,
|
||||||
|
' sp': 203,
|
||||||
|
'dis': 204,
|
||||||
|
'eli': 205,
|
||||||
|
'liq': 206,
|
||||||
|
'lis': 207,
|
||||||
|
'men': 208,
|
||||||
|
'mus': 209,
|
||||||
|
'num': 210,
|
||||||
|
'pos': 211,
|
||||||
|
'sio': 212,
|
||||||
|
' an': 213,
|
||||||
|
' gr': 214,
|
||||||
|
'abi': 215,
|
||||||
|
'acc': 216,
|
||||||
|
'ect': 217,
|
||||||
|
'ri ': 218,
|
||||||
|
'uan': 219,
|
||||||
|
' le': 220,
|
||||||
|
'ecc': 221,
|
||||||
|
'ete': 222,
|
||||||
|
'gra': 223,
|
||||||
|
'non': 224,
|
||||||
|
'se ': 225,
|
||||||
|
'uen': 226,
|
||||||
|
'uis': 227,
|
||||||
|
' fa': 228,
|
||||||
|
' tr': 229,
|
||||||
|
'ate': 230,
|
||||||
|
'e c': 231,
|
||||||
|
'fil': 232,
|
||||||
|
'na ': 233,
|
||||||
|
'ni ': 234,
|
||||||
|
'pul': 235,
|
||||||
|
's f': 236,
|
||||||
|
'ui ': 237,
|
||||||
|
'at ': 238,
|
||||||
|
'cce': 239,
|
||||||
|
'dam': 240,
|
||||||
|
'i e': 241,
|
||||||
|
'ina': 242,
|
||||||
|
'leg': 243,
|
||||||
|
'nos': 244,
|
||||||
|
'ori': 245,
|
||||||
|
'pec': 246,
|
||||||
|
'rop': 247,
|
||||||
|
'sta': 248,
|
||||||
|
'uia': 249,
|
||||||
|
'ene': 250,
|
||||||
|
'iue': 251,
|
||||||
|
'iui': 252,
|
||||||
|
'siu': 253,
|
||||||
|
't t': 254,
|
||||||
|
't u': 255,
|
||||||
|
'tib': 256,
|
||||||
|
'tit': 257,
|
||||||
|
' da': 258,
|
||||||
|
' ne': 259,
|
||||||
|
'a d': 260,
|
||||||
|
'and': 261,
|
||||||
|
'ege': 262,
|
||||||
|
'equ': 263,
|
||||||
|
'hom': 264,
|
||||||
|
'imu': 265,
|
||||||
|
'lor': 266,
|
||||||
|
'm m': 267,
|
||||||
|
'mni': 268,
|
||||||
|
'ndo': 269,
|
||||||
|
'ner': 270,
|
||||||
|
'o e': 271,
|
||||||
|
'r e': 272,
|
||||||
|
'sit': 273,
|
||||||
|
'tum': 274,
|
||||||
|
'utu': 275,
|
||||||
|
'a p': 276,
|
||||||
|
'bis': 277,
|
||||||
|
'bit': 278,
|
||||||
|
'cer': 279,
|
||||||
|
'cta': 280,
|
||||||
|
'dom': 281,
|
||||||
|
'fut': 282,
|
||||||
|
'i s': 283,
|
||||||
|
'ign': 284,
|
||||||
|
'int': 285,
|
||||||
|
'mod': 286,
|
||||||
|
'ndu': 287,
|
||||||
|
'nit': 288,
|
||||||
|
'rib': 289,
|
||||||
|
'rti': 290,
|
||||||
|
'tas': 291,
|
||||||
|
'und': 292,
|
||||||
|
' ab': 293,
|
||||||
|
'err': 294,
|
||||||
|
'ers': 295,
|
||||||
|
'ite': 296,
|
||||||
|
'iti': 297,
|
||||||
|
'm t': 298,
|
||||||
|
'o p': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/lt.py
Normal file
303
libs/guess_language/data/models/lt.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'as ': 0,
|
||||||
|
' pa': 1,
|
||||||
|
' ka': 2,
|
||||||
|
'ai ': 3,
|
||||||
|
'us ': 4,
|
||||||
|
'os ': 5,
|
||||||
|
'is ': 6,
|
||||||
|
' ne': 7,
|
||||||
|
' ir': 8,
|
||||||
|
'ir ': 9,
|
||||||
|
'ti ': 10,
|
||||||
|
' pr': 11,
|
||||||
|
'aus': 12,
|
||||||
|
'ini': 13,
|
||||||
|
's p': 14,
|
||||||
|
'pas': 15,
|
||||||
|
'ių ': 16,
|
||||||
|
' ta': 17,
|
||||||
|
' vi': 18,
|
||||||
|
'iau': 19,
|
||||||
|
' ko': 20,
|
||||||
|
' su': 21,
|
||||||
|
'kai': 22,
|
||||||
|
'o p': 23,
|
||||||
|
'usi': 24,
|
||||||
|
' sa': 25,
|
||||||
|
'vo ': 26,
|
||||||
|
'tai': 27,
|
||||||
|
'ali': 28,
|
||||||
|
'tų ': 29,
|
||||||
|
'io ': 30,
|
||||||
|
'jo ': 31,
|
||||||
|
's k': 32,
|
||||||
|
'sta': 33,
|
||||||
|
'iai': 34,
|
||||||
|
' bu': 35,
|
||||||
|
' nu': 36,
|
||||||
|
'ius': 37,
|
||||||
|
'mo ': 38,
|
||||||
|
' po': 39,
|
||||||
|
'ien': 40,
|
||||||
|
's s': 41,
|
||||||
|
'tas': 42,
|
||||||
|
' me': 43,
|
||||||
|
'uvo': 44,
|
||||||
|
'kad': 45,
|
||||||
|
' iš': 46,
|
||||||
|
' la': 47,
|
||||||
|
'to ': 48,
|
||||||
|
'ais': 49,
|
||||||
|
'ie ': 50,
|
||||||
|
'kur': 51,
|
||||||
|
'uri': 52,
|
||||||
|
' ku': 53,
|
||||||
|
'ijo': 54,
|
||||||
|
'čia': 55,
|
||||||
|
'au ': 56,
|
||||||
|
'met': 57,
|
||||||
|
'je ': 58,
|
||||||
|
' va': 59,
|
||||||
|
'ad ': 60,
|
||||||
|
' ap': 61,
|
||||||
|
'and': 62,
|
||||||
|
' gr': 63,
|
||||||
|
' ti': 64,
|
||||||
|
'kal': 65,
|
||||||
|
'asi': 66,
|
||||||
|
'i p': 67,
|
||||||
|
'iči': 68,
|
||||||
|
's i': 69,
|
||||||
|
's v': 70,
|
||||||
|
'ink': 71,
|
||||||
|
'o n': 72,
|
||||||
|
'ės ': 73,
|
||||||
|
'buv': 74,
|
||||||
|
's a': 75,
|
||||||
|
' ga': 76,
|
||||||
|
'aip': 77,
|
||||||
|
'avi': 78,
|
||||||
|
'mas': 79,
|
||||||
|
'pri': 80,
|
||||||
|
'tik': 81,
|
||||||
|
' re': 82,
|
||||||
|
'etu': 83,
|
||||||
|
'jos': 84,
|
||||||
|
' da': 85,
|
||||||
|
'ent': 86,
|
||||||
|
'oli': 87,
|
||||||
|
'par': 88,
|
||||||
|
'ant': 89,
|
||||||
|
'ara': 90,
|
||||||
|
'tar': 91,
|
||||||
|
'ama': 92,
|
||||||
|
'gal': 93,
|
||||||
|
'imo': 94,
|
||||||
|
'išk': 95,
|
||||||
|
'o s': 96,
|
||||||
|
' at': 97,
|
||||||
|
' be': 98,
|
||||||
|
' į ': 99,
|
||||||
|
'min': 100,
|
||||||
|
'tin': 101,
|
||||||
|
' tu': 102,
|
||||||
|
's n': 103,
|
||||||
|
' jo': 104,
|
||||||
|
'dar': 105,
|
||||||
|
'ip ': 106,
|
||||||
|
'rei': 107,
|
||||||
|
' te': 108,
|
||||||
|
'dži': 109,
|
||||||
|
'kas': 110,
|
||||||
|
'nin': 111,
|
||||||
|
'tei': 112,
|
||||||
|
'vie': 113,
|
||||||
|
' li': 114,
|
||||||
|
' se': 115,
|
||||||
|
'cij': 116,
|
||||||
|
'gar': 117,
|
||||||
|
'lai': 118,
|
||||||
|
'art': 119,
|
||||||
|
'lau': 120,
|
||||||
|
'ras': 121,
|
||||||
|
'no ': 122,
|
||||||
|
'o k': 123,
|
||||||
|
'tą ': 124,
|
||||||
|
' ar': 125,
|
||||||
|
'ėjo': 126,
|
||||||
|
'vič': 127,
|
||||||
|
'iga': 128,
|
||||||
|
'pra': 129,
|
||||||
|
'vis': 130,
|
||||||
|
' na': 131,
|
||||||
|
'men': 132,
|
||||||
|
'oki': 133,
|
||||||
|
'raš': 134,
|
||||||
|
's t': 135,
|
||||||
|
'iet': 136,
|
||||||
|
'ika': 137,
|
||||||
|
'int': 138,
|
||||||
|
'kom': 139,
|
||||||
|
'tam': 140,
|
||||||
|
'aug': 141,
|
||||||
|
'avo': 142,
|
||||||
|
'rie': 143,
|
||||||
|
's b': 144,
|
||||||
|
' st': 145,
|
||||||
|
'eim': 146,
|
||||||
|
'ko ': 147,
|
||||||
|
'nus': 148,
|
||||||
|
'pol': 149,
|
||||||
|
'ria': 150,
|
||||||
|
'sau': 151,
|
||||||
|
'api': 152,
|
||||||
|
'me ': 153,
|
||||||
|
'ne ': 154,
|
||||||
|
'sik': 155,
|
||||||
|
' ši': 156,
|
||||||
|
'i n': 157,
|
||||||
|
'ia ': 158,
|
||||||
|
'ici': 159,
|
||||||
|
'oja': 160,
|
||||||
|
'sak': 161,
|
||||||
|
'sti': 162,
|
||||||
|
'ui ': 163,
|
||||||
|
'ame': 164,
|
||||||
|
'lie': 165,
|
||||||
|
'o t': 166,
|
||||||
|
'pie': 167,
|
||||||
|
'čiu': 168,
|
||||||
|
' di': 169,
|
||||||
|
' pe': 170,
|
||||||
|
'gri': 171,
|
||||||
|
'ios': 172,
|
||||||
|
'lia': 173,
|
||||||
|
'lin': 174,
|
||||||
|
's d': 175,
|
||||||
|
's g': 176,
|
||||||
|
'ta ': 177,
|
||||||
|
'uot': 178,
|
||||||
|
' ja': 179,
|
||||||
|
' už': 180,
|
||||||
|
'aut': 181,
|
||||||
|
'i s': 182,
|
||||||
|
'ino': 183,
|
||||||
|
'mą ': 184,
|
||||||
|
'oje': 185,
|
||||||
|
'rav': 186,
|
||||||
|
'dėl': 187,
|
||||||
|
'nti': 188,
|
||||||
|
'o a': 189,
|
||||||
|
'toj': 190,
|
||||||
|
'ėl ': 191,
|
||||||
|
' to': 192,
|
||||||
|
' vy': 193,
|
||||||
|
'ar ': 194,
|
||||||
|
'ina': 195,
|
||||||
|
'lic': 196,
|
||||||
|
'o v': 197,
|
||||||
|
'sei': 198,
|
||||||
|
'su ': 199,
|
||||||
|
' mi': 200,
|
||||||
|
' pi': 201,
|
||||||
|
'din': 202,
|
||||||
|
'iš ': 203,
|
||||||
|
'lan': 204,
|
||||||
|
'si ': 205,
|
||||||
|
'tus': 206,
|
||||||
|
' ba': 207,
|
||||||
|
'asa': 208,
|
||||||
|
'ata': 209,
|
||||||
|
'kla': 210,
|
||||||
|
'omi': 211,
|
||||||
|
'tat': 212,
|
||||||
|
' an': 213,
|
||||||
|
' ji': 214,
|
||||||
|
'als': 215,
|
||||||
|
'ena': 216,
|
||||||
|
'jų ': 217,
|
||||||
|
'nuo': 218,
|
||||||
|
'per': 219,
|
||||||
|
'rig': 220,
|
||||||
|
's m': 221,
|
||||||
|
'val': 222,
|
||||||
|
'yta': 223,
|
||||||
|
'čio': 224,
|
||||||
|
' ra': 225,
|
||||||
|
'i k': 226,
|
||||||
|
'lik': 227,
|
||||||
|
'net': 228,
|
||||||
|
'nė ': 229,
|
||||||
|
'tis': 230,
|
||||||
|
'tuo': 231,
|
||||||
|
'yti': 232,
|
||||||
|
'ęs ': 233,
|
||||||
|
'ų s': 234,
|
||||||
|
'ada': 235,
|
||||||
|
'ari': 236,
|
||||||
|
'do ': 237,
|
||||||
|
'eik': 238,
|
||||||
|
'eis': 239,
|
||||||
|
'ist': 240,
|
||||||
|
'lst': 241,
|
||||||
|
'ma ': 242,
|
||||||
|
'nes': 243,
|
||||||
|
'sav': 244,
|
||||||
|
'sio': 245,
|
||||||
|
'tau': 246,
|
||||||
|
' ki': 247,
|
||||||
|
'aik': 248,
|
||||||
|
'aud': 249,
|
||||||
|
'ies': 250,
|
||||||
|
'ori': 251,
|
||||||
|
's r': 252,
|
||||||
|
'ska': 253,
|
||||||
|
' ge': 254,
|
||||||
|
'ast': 255,
|
||||||
|
'eig': 256,
|
||||||
|
'et ': 257,
|
||||||
|
'iam': 258,
|
||||||
|
'isa': 259,
|
||||||
|
'mis': 260,
|
||||||
|
'nam': 261,
|
||||||
|
'ome': 262,
|
||||||
|
'žia': 263,
|
||||||
|
'aba': 264,
|
||||||
|
'aul': 265,
|
||||||
|
'ikr': 266,
|
||||||
|
'ką ': 267,
|
||||||
|
'nta': 268,
|
||||||
|
'ra ': 269,
|
||||||
|
'tur': 270,
|
||||||
|
' ma': 271,
|
||||||
|
'die': 272,
|
||||||
|
'ei ': 273,
|
||||||
|
'i t': 274,
|
||||||
|
'nas': 275,
|
||||||
|
'rin': 276,
|
||||||
|
'sto': 277,
|
||||||
|
'tie': 278,
|
||||||
|
'tuv': 279,
|
||||||
|
'vos': 280,
|
||||||
|
'ų p': 281,
|
||||||
|
' dė': 282,
|
||||||
|
'are': 283,
|
||||||
|
'ats': 284,
|
||||||
|
'enė': 285,
|
||||||
|
'ili': 286,
|
||||||
|
'ima': 287,
|
||||||
|
'kar': 288,
|
||||||
|
'ms ': 289,
|
||||||
|
'nia': 290,
|
||||||
|
'r p': 291,
|
||||||
|
'rod': 292,
|
||||||
|
's l': 293,
|
||||||
|
' o ': 294,
|
||||||
|
'e p': 295,
|
||||||
|
'es ': 296,
|
||||||
|
'ide': 297,
|
||||||
|
'ik ': 298,
|
||||||
|
'ja ': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/lv.py
Normal file
303
libs/guess_language/data/models/lv.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'as ': 0,
|
||||||
|
' la': 1,
|
||||||
|
' pa': 2,
|
||||||
|
' ne': 3,
|
||||||
|
'es ': 4,
|
||||||
|
' un': 5,
|
||||||
|
'un ': 6,
|
||||||
|
' ka': 7,
|
||||||
|
' va': 8,
|
||||||
|
'ar ': 9,
|
||||||
|
's p': 10,
|
||||||
|
' ar': 11,
|
||||||
|
' vi': 12,
|
||||||
|
'is ': 13,
|
||||||
|
'ai ': 14,
|
||||||
|
' no': 15,
|
||||||
|
'ja ': 16,
|
||||||
|
'ija': 17,
|
||||||
|
'iem': 18,
|
||||||
|
'em ': 19,
|
||||||
|
'tu ': 20,
|
||||||
|
'tie': 21,
|
||||||
|
'vie': 22,
|
||||||
|
'lat': 23,
|
||||||
|
'aks': 24,
|
||||||
|
'ien': 25,
|
||||||
|
'kst': 26,
|
||||||
|
'ies': 27,
|
||||||
|
's a': 28,
|
||||||
|
'rak': 29,
|
||||||
|
'atv': 30,
|
||||||
|
'tvi': 31,
|
||||||
|
' ja': 32,
|
||||||
|
' pi': 33,
|
||||||
|
'ka ': 34,
|
||||||
|
' ir': 35,
|
||||||
|
'ir ': 36,
|
||||||
|
'ta ': 37,
|
||||||
|
' sa': 38,
|
||||||
|
'ts ': 39,
|
||||||
|
' kā': 40,
|
||||||
|
'ās ': 41,
|
||||||
|
' ti': 42,
|
||||||
|
'ot ': 43,
|
||||||
|
's n': 44,
|
||||||
|
' ie': 45,
|
||||||
|
' ta': 46,
|
||||||
|
'arī': 47,
|
||||||
|
'par': 48,
|
||||||
|
'pie': 49,
|
||||||
|
' pr': 50,
|
||||||
|
'kā ': 51,
|
||||||
|
' at': 52,
|
||||||
|
' ra': 53,
|
||||||
|
'am ': 54,
|
||||||
|
'inā': 55,
|
||||||
|
'tā ': 56,
|
||||||
|
' iz': 57,
|
||||||
|
'jas': 58,
|
||||||
|
'lai': 59,
|
||||||
|
' na': 60,
|
||||||
|
'aut': 61,
|
||||||
|
'ieš': 62,
|
||||||
|
's s': 63,
|
||||||
|
' ap': 64,
|
||||||
|
' ko': 65,
|
||||||
|
' st': 66,
|
||||||
|
'iek': 67,
|
||||||
|
'iet': 68,
|
||||||
|
'jau': 69,
|
||||||
|
'us ': 70,
|
||||||
|
'rī ': 71,
|
||||||
|
'tik': 72,
|
||||||
|
'ība': 73,
|
||||||
|
'na ': 74,
|
||||||
|
' ga': 75,
|
||||||
|
'cij': 76,
|
||||||
|
's i': 77,
|
||||||
|
' uz': 78,
|
||||||
|
'jum': 79,
|
||||||
|
's v': 80,
|
||||||
|
'ms ': 81,
|
||||||
|
'var': 82,
|
||||||
|
' ku': 83,
|
||||||
|
' ma': 84,
|
||||||
|
'jā ': 85,
|
||||||
|
'sta': 86,
|
||||||
|
's u': 87,
|
||||||
|
' tā': 88,
|
||||||
|
'die': 89,
|
||||||
|
'kai': 90,
|
||||||
|
'kas': 91,
|
||||||
|
'ska': 92,
|
||||||
|
' ci': 93,
|
||||||
|
' da': 94,
|
||||||
|
'kur': 95,
|
||||||
|
'lie': 96,
|
||||||
|
'tas': 97,
|
||||||
|
'a p': 98,
|
||||||
|
'est': 99,
|
||||||
|
'stā': 100,
|
||||||
|
'šan': 101,
|
||||||
|
'nes': 102,
|
||||||
|
'nie': 103,
|
||||||
|
's d': 104,
|
||||||
|
's m': 105,
|
||||||
|
'val': 106,
|
||||||
|
' di': 107,
|
||||||
|
' es': 108,
|
||||||
|
' re': 109,
|
||||||
|
'no ': 110,
|
||||||
|
'to ': 111,
|
||||||
|
'umu': 112,
|
||||||
|
'vai': 113,
|
||||||
|
'ši ': 114,
|
||||||
|
' vē': 115,
|
||||||
|
'kum': 116,
|
||||||
|
'nu ': 117,
|
||||||
|
'rie': 118,
|
||||||
|
's t': 119,
|
||||||
|
'ām ': 120,
|
||||||
|
'ad ': 121,
|
||||||
|
'et ': 122,
|
||||||
|
'mu ': 123,
|
||||||
|
's l': 124,
|
||||||
|
' be': 125,
|
||||||
|
'aud': 126,
|
||||||
|
'tur': 127,
|
||||||
|
'vij': 128,
|
||||||
|
'viņ': 129,
|
||||||
|
'āju': 130,
|
||||||
|
'bas': 131,
|
||||||
|
'gad': 132,
|
||||||
|
'i n': 133,
|
||||||
|
'ika': 134,
|
||||||
|
'os ': 135,
|
||||||
|
'a v': 136,
|
||||||
|
'not': 137,
|
||||||
|
'oti': 138,
|
||||||
|
'sts': 139,
|
||||||
|
'aik': 140,
|
||||||
|
'u a': 141,
|
||||||
|
'ā a': 142,
|
||||||
|
'āk ': 143,
|
||||||
|
' to': 144,
|
||||||
|
'ied': 145,
|
||||||
|
'stu': 146,
|
||||||
|
'ti ': 147,
|
||||||
|
'u p': 148,
|
||||||
|
'vēl': 149,
|
||||||
|
'āci': 150,
|
||||||
|
' šo': 151,
|
||||||
|
'gi ': 152,
|
||||||
|
'ko ': 153,
|
||||||
|
'pro': 154,
|
||||||
|
's r': 155,
|
||||||
|
'tāj': 156,
|
||||||
|
'u s': 157,
|
||||||
|
'u v': 158,
|
||||||
|
'vis': 159,
|
||||||
|
'aun': 160,
|
||||||
|
'ks ': 161,
|
||||||
|
'str': 162,
|
||||||
|
'zin': 163,
|
||||||
|
'a a': 164,
|
||||||
|
'adī': 165,
|
||||||
|
'da ': 166,
|
||||||
|
'dar': 167,
|
||||||
|
'ena': 168,
|
||||||
|
'ici': 169,
|
||||||
|
'kra': 170,
|
||||||
|
'nas': 171,
|
||||||
|
'stī': 172,
|
||||||
|
'šu ': 173,
|
||||||
|
' mē': 174,
|
||||||
|
'a n': 175,
|
||||||
|
'eci': 176,
|
||||||
|
'i s': 177,
|
||||||
|
'ie ': 178,
|
||||||
|
'iņa': 179,
|
||||||
|
'ju ': 180,
|
||||||
|
'las': 181,
|
||||||
|
'r t': 182,
|
||||||
|
'ums': 183,
|
||||||
|
'šie': 184,
|
||||||
|
'bu ': 185,
|
||||||
|
'cit': 186,
|
||||||
|
'i a': 187,
|
||||||
|
'ina': 188,
|
||||||
|
'ma ': 189,
|
||||||
|
'pus': 190,
|
||||||
|
'ra ': 191,
|
||||||
|
' au': 192,
|
||||||
|
' se': 193,
|
||||||
|
' sl': 194,
|
||||||
|
'a s': 195,
|
||||||
|
'ais': 196,
|
||||||
|
'eši': 197,
|
||||||
|
'iec': 198,
|
||||||
|
'iku': 199,
|
||||||
|
'pār': 200,
|
||||||
|
's b': 201,
|
||||||
|
's k': 202,
|
||||||
|
'sot': 203,
|
||||||
|
'ādā': 204,
|
||||||
|
' in': 205,
|
||||||
|
' li': 206,
|
||||||
|
' tr': 207,
|
||||||
|
'ana': 208,
|
||||||
|
'eso': 209,
|
||||||
|
'ikr': 210,
|
||||||
|
'man': 211,
|
||||||
|
'ne ': 212,
|
||||||
|
'u k': 213,
|
||||||
|
' tu': 214,
|
||||||
|
'an ': 215,
|
||||||
|
'av ': 216,
|
||||||
|
'bet': 217,
|
||||||
|
'būt': 218,
|
||||||
|
'im ': 219,
|
||||||
|
'isk': 220,
|
||||||
|
'līd': 221,
|
||||||
|
'nav': 222,
|
||||||
|
'ras': 223,
|
||||||
|
'ri ': 224,
|
||||||
|
's g': 225,
|
||||||
|
'sti': 226,
|
||||||
|
'īdz': 227,
|
||||||
|
' ai': 228,
|
||||||
|
'arb': 229,
|
||||||
|
'cin': 230,
|
||||||
|
'das': 231,
|
||||||
|
'ent': 232,
|
||||||
|
'gal': 233,
|
||||||
|
'i p': 234,
|
||||||
|
'lik': 235,
|
||||||
|
'mā ': 236,
|
||||||
|
'nek': 237,
|
||||||
|
'pat': 238,
|
||||||
|
'rēt': 239,
|
||||||
|
'si ': 240,
|
||||||
|
'tra': 241,
|
||||||
|
'uši': 242,
|
||||||
|
'vei': 243,
|
||||||
|
' br': 244,
|
||||||
|
' pu': 245,
|
||||||
|
' sk': 246,
|
||||||
|
'als': 247,
|
||||||
|
'ama': 248,
|
||||||
|
'edz': 249,
|
||||||
|
'eka': 250,
|
||||||
|
'ešu': 251,
|
||||||
|
'ieg': 252,
|
||||||
|
'jis': 253,
|
||||||
|
'kam': 254,
|
||||||
|
'lst': 255,
|
||||||
|
'nāk': 256,
|
||||||
|
'oli': 257,
|
||||||
|
'pre': 258,
|
||||||
|
'pēc': 259,
|
||||||
|
'rot': 260,
|
||||||
|
'tās': 261,
|
||||||
|
'usi': 262,
|
||||||
|
'ēl ': 263,
|
||||||
|
'ēs ': 264,
|
||||||
|
' bi': 265,
|
||||||
|
' de': 266,
|
||||||
|
' me': 267,
|
||||||
|
' pā': 268,
|
||||||
|
'a i': 269,
|
||||||
|
'aid': 270,
|
||||||
|
'ajā': 271,
|
||||||
|
'ikt': 272,
|
||||||
|
'kat': 273,
|
||||||
|
'lic': 274,
|
||||||
|
'lod': 275,
|
||||||
|
'mi ': 276,
|
||||||
|
'ni ': 277,
|
||||||
|
'pri': 278,
|
||||||
|
'rād': 279,
|
||||||
|
'rīg': 280,
|
||||||
|
'sim': 281,
|
||||||
|
'trā': 282,
|
||||||
|
'u l': 283,
|
||||||
|
'uto': 284,
|
||||||
|
'uz ': 285,
|
||||||
|
'ēc ': 286,
|
||||||
|
'ītā': 287,
|
||||||
|
' ce': 288,
|
||||||
|
' jā': 289,
|
||||||
|
' sv': 290,
|
||||||
|
'a t': 291,
|
||||||
|
'aga': 292,
|
||||||
|
'aiz': 293,
|
||||||
|
'atu': 294,
|
||||||
|
'ba ': 295,
|
||||||
|
'cie': 296,
|
||||||
|
'du ': 297,
|
||||||
|
'dzi': 298,
|
||||||
|
'dzī': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/mk.py
Normal file
303
libs/guess_language/data/models/mk.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'на ': 0,
|
||||||
|
' на': 1,
|
||||||
|
'та ': 2,
|
||||||
|
'ата': 3,
|
||||||
|
'ија': 4,
|
||||||
|
' пр': 5,
|
||||||
|
'то ': 6,
|
||||||
|
'ја ': 7,
|
||||||
|
' за': 8,
|
||||||
|
'а н': 9,
|
||||||
|
' и ': 10,
|
||||||
|
'а с': 11,
|
||||||
|
'те ': 12,
|
||||||
|
'ите': 13,
|
||||||
|
' ко': 14,
|
||||||
|
'от ': 15,
|
||||||
|
' де': 16,
|
||||||
|
' по': 17,
|
||||||
|
'а д': 18,
|
||||||
|
'во ': 19,
|
||||||
|
'за ': 20,
|
||||||
|
' во': 21,
|
||||||
|
' од': 22,
|
||||||
|
' се': 23,
|
||||||
|
' не': 24,
|
||||||
|
'се ': 25,
|
||||||
|
' до': 26,
|
||||||
|
'а в': 27,
|
||||||
|
'ка ': 28,
|
||||||
|
'ање': 29,
|
||||||
|
'а п': 30,
|
||||||
|
'о п': 31,
|
||||||
|
'ува': 32,
|
||||||
|
'циј': 33,
|
||||||
|
'а о': 34,
|
||||||
|
'ици': 35,
|
||||||
|
'ето': 36,
|
||||||
|
'о н': 37,
|
||||||
|
'ани': 38,
|
||||||
|
'ни ': 39,
|
||||||
|
' вл': 40,
|
||||||
|
'дек': 41,
|
||||||
|
'ека': 42,
|
||||||
|
'њет': 43,
|
||||||
|
'ќе ': 44,
|
||||||
|
' е ': 45,
|
||||||
|
'а з': 46,
|
||||||
|
'а и': 47,
|
||||||
|
'ат ': 48,
|
||||||
|
'вла': 49,
|
||||||
|
'го ': 50,
|
||||||
|
'е н': 51,
|
||||||
|
'од ': 52,
|
||||||
|
'пре': 53,
|
||||||
|
' го': 54,
|
||||||
|
' да': 55,
|
||||||
|
' ма': 56,
|
||||||
|
' ре': 57,
|
||||||
|
' ќе': 58,
|
||||||
|
'али': 59,
|
||||||
|
'и д': 60,
|
||||||
|
'и н': 61,
|
||||||
|
'иот': 62,
|
||||||
|
'нат': 63,
|
||||||
|
'ово': 64,
|
||||||
|
' па': 65,
|
||||||
|
' ра': 66,
|
||||||
|
' со': 67,
|
||||||
|
'ове': 68,
|
||||||
|
'пра': 69,
|
||||||
|
'што': 70,
|
||||||
|
'ње ': 71,
|
||||||
|
'а е': 72,
|
||||||
|
'да ': 73,
|
||||||
|
'дат': 74,
|
||||||
|
'дон': 75,
|
||||||
|
'е в': 76,
|
||||||
|
'е д': 77,
|
||||||
|
'е з': 78,
|
||||||
|
'е с': 79,
|
||||||
|
'кон': 80,
|
||||||
|
'нит': 81,
|
||||||
|
'но ': 82,
|
||||||
|
'они': 83,
|
||||||
|
'ото': 84,
|
||||||
|
'пар': 85,
|
||||||
|
'при': 86,
|
||||||
|
'ста': 87,
|
||||||
|
'т н': 88,
|
||||||
|
' шт': 89,
|
||||||
|
'а к': 90,
|
||||||
|
'аци': 91,
|
||||||
|
'ва ': 92,
|
||||||
|
'вањ': 93,
|
||||||
|
'е п': 94,
|
||||||
|
'ени': 95,
|
||||||
|
'ла ': 96,
|
||||||
|
'лад': 97,
|
||||||
|
'мак': 98,
|
||||||
|
'нес': 99,
|
||||||
|
'нос': 100,
|
||||||
|
'про': 101,
|
||||||
|
'рен': 102,
|
||||||
|
'јат': 103,
|
||||||
|
' ин': 104,
|
||||||
|
' ме': 105,
|
||||||
|
' то': 106,
|
||||||
|
'а г': 107,
|
||||||
|
'а м': 108,
|
||||||
|
'а р': 109,
|
||||||
|
'аке': 110,
|
||||||
|
'ако': 111,
|
||||||
|
'вор': 112,
|
||||||
|
'гов': 113,
|
||||||
|
'едо': 114,
|
||||||
|
'ена': 115,
|
||||||
|
'и и': 116,
|
||||||
|
'ира': 117,
|
||||||
|
'кед': 118,
|
||||||
|
'не ': 119,
|
||||||
|
'ниц': 120,
|
||||||
|
'ниј': 121,
|
||||||
|
'ост': 122,
|
||||||
|
'ра ': 123,
|
||||||
|
'рат': 124,
|
||||||
|
'ред': 125,
|
||||||
|
'ска': 126,
|
||||||
|
'тен': 127,
|
||||||
|
' ка': 128,
|
||||||
|
' сп': 129,
|
||||||
|
' ја': 130,
|
||||||
|
'а т': 131,
|
||||||
|
'аде': 132,
|
||||||
|
'арт': 133,
|
||||||
|
'е г': 134,
|
||||||
|
'е и': 135,
|
||||||
|
'кат': 136,
|
||||||
|
'лас': 137,
|
||||||
|
'нио': 138,
|
||||||
|
'о с': 139,
|
||||||
|
'ри ': 140,
|
||||||
|
' ба': 141,
|
||||||
|
' би': 142,
|
||||||
|
'ава': 143,
|
||||||
|
'ате': 144,
|
||||||
|
'вни': 145,
|
||||||
|
'д н': 146,
|
||||||
|
'ден': 147,
|
||||||
|
'дов': 148,
|
||||||
|
'држ': 149,
|
||||||
|
'дув': 150,
|
||||||
|
'е о': 151,
|
||||||
|
'ен ': 152,
|
||||||
|
'ере': 153,
|
||||||
|
'ери': 154,
|
||||||
|
'и п': 155,
|
||||||
|
'и с': 156,
|
||||||
|
'ина': 157,
|
||||||
|
'кој': 158,
|
||||||
|
'нци': 159,
|
||||||
|
'о м': 160,
|
||||||
|
'о о': 161,
|
||||||
|
'одн': 162,
|
||||||
|
'пор': 163,
|
||||||
|
'ски': 164,
|
||||||
|
'спо': 165,
|
||||||
|
'ств': 166,
|
||||||
|
'сти': 167,
|
||||||
|
'тво': 168,
|
||||||
|
'ти ': 169,
|
||||||
|
' об': 170,
|
||||||
|
' ов': 171,
|
||||||
|
'а б': 172,
|
||||||
|
'алн': 173,
|
||||||
|
'ара': 174,
|
||||||
|
'бар': 175,
|
||||||
|
'е к': 176,
|
||||||
|
'ед ': 177,
|
||||||
|
'ент': 178,
|
||||||
|
'еѓу': 179,
|
||||||
|
'и о': 180,
|
||||||
|
'ии ': 181,
|
||||||
|
'меѓ': 182,
|
||||||
|
'о д': 183,
|
||||||
|
'оја': 184,
|
||||||
|
'пот': 185,
|
||||||
|
'раз': 186,
|
||||||
|
'раш': 187,
|
||||||
|
'спр': 188,
|
||||||
|
'сто': 189,
|
||||||
|
'т д': 190,
|
||||||
|
'ци ': 191,
|
||||||
|
' бе': 192,
|
||||||
|
' гр': 193,
|
||||||
|
' др': 194,
|
||||||
|
' из': 195,
|
||||||
|
' ст': 196,
|
||||||
|
'аа ': 197,
|
||||||
|
'бид': 198,
|
||||||
|
'вед': 199,
|
||||||
|
'гла': 200,
|
||||||
|
'еко': 201,
|
||||||
|
'енд': 202,
|
||||||
|
'есе': 203,
|
||||||
|
'етс': 204,
|
||||||
|
'зац': 205,
|
||||||
|
'и т': 206,
|
||||||
|
'иза': 207,
|
||||||
|
'инс': 208,
|
||||||
|
'ист': 209,
|
||||||
|
'ки ': 210,
|
||||||
|
'ков': 211,
|
||||||
|
'кол': 212,
|
||||||
|
'ку ': 213,
|
||||||
|
'лиц': 214,
|
||||||
|
'о з': 215,
|
||||||
|
'о и': 216,
|
||||||
|
'ова': 217,
|
||||||
|
'олк': 218,
|
||||||
|
'оре': 219,
|
||||||
|
'ори': 220,
|
||||||
|
'под': 221,
|
||||||
|
'рањ': 222,
|
||||||
|
'реф': 223,
|
||||||
|
'ржа': 224,
|
||||||
|
'ров': 225,
|
||||||
|
'рти': 226,
|
||||||
|
'со ': 227,
|
||||||
|
'тор': 228,
|
||||||
|
'фер': 229,
|
||||||
|
'цен': 230,
|
||||||
|
'цит': 231,
|
||||||
|
' а ': 232,
|
||||||
|
' вр': 233,
|
||||||
|
' гл': 234,
|
||||||
|
' дп': 235,
|
||||||
|
' мо': 236,
|
||||||
|
' ни': 237,
|
||||||
|
' но': 238,
|
||||||
|
' оп': 239,
|
||||||
|
' от': 240,
|
||||||
|
'а ќ': 241,
|
||||||
|
'або': 242,
|
||||||
|
'ада': 243,
|
||||||
|
'аса': 244,
|
||||||
|
'аша': 245,
|
||||||
|
'ба ': 246,
|
||||||
|
'бот': 247,
|
||||||
|
'ваа': 248,
|
||||||
|
'ват': 249,
|
||||||
|
'вот': 250,
|
||||||
|
'ги ': 251,
|
||||||
|
'гра': 252,
|
||||||
|
'де ': 253,
|
||||||
|
'дин': 254,
|
||||||
|
'дум': 255,
|
||||||
|
'евр': 256,
|
||||||
|
'еду': 257,
|
||||||
|
'ено': 258,
|
||||||
|
'ера': 259,
|
||||||
|
'ес ': 260,
|
||||||
|
'ење': 261,
|
||||||
|
'же ': 262,
|
||||||
|
'зак': 263,
|
||||||
|
'и в': 264,
|
||||||
|
'ила': 265,
|
||||||
|
'иту': 266,
|
||||||
|
'коа': 267,
|
||||||
|
'кои': 268,
|
||||||
|
'лан': 269,
|
||||||
|
'лку': 270,
|
||||||
|
'лож': 271,
|
||||||
|
'мот': 272,
|
||||||
|
'нду': 273,
|
||||||
|
'нст': 274,
|
||||||
|
'о в': 275,
|
||||||
|
'оа ': 276,
|
||||||
|
'оал': 277,
|
||||||
|
'обр': 278,
|
||||||
|
'ов ': 279,
|
||||||
|
'ови': 280,
|
||||||
|
'овн': 281,
|
||||||
|
'ои ': 282,
|
||||||
|
'ор ': 283,
|
||||||
|
'орм': 284,
|
||||||
|
'ој ': 285,
|
||||||
|
'рет': 286,
|
||||||
|
'сед': 287,
|
||||||
|
'ст ': 288,
|
||||||
|
'тер': 289,
|
||||||
|
'тиј': 290,
|
||||||
|
'тоа': 291,
|
||||||
|
'фор': 292,
|
||||||
|
'ции': 293,
|
||||||
|
'ѓу ': 294,
|
||||||
|
' ал': 295,
|
||||||
|
' ве': 296,
|
||||||
|
' вм': 297,
|
||||||
|
' ги': 298,
|
||||||
|
' ду': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/mn.py
Normal file
303
libs/guess_language/data/models/mn.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'ын ': 0,
|
||||||
|
' ба': 1,
|
||||||
|
'йн ': 2,
|
||||||
|
'бай': 3,
|
||||||
|
'ийн': 4,
|
||||||
|
'уул': 5,
|
||||||
|
' ул': 6,
|
||||||
|
'улс': 7,
|
||||||
|
'ан ': 8,
|
||||||
|
' ха': 9,
|
||||||
|
'ний': 10,
|
||||||
|
'н х': 11,
|
||||||
|
'гаа': 12,
|
||||||
|
'сын': 13,
|
||||||
|
'ий ': 14,
|
||||||
|
'лсы': 15,
|
||||||
|
' бо': 16,
|
||||||
|
'й б': 17,
|
||||||
|
'эн ': 18,
|
||||||
|
'ах ': 19,
|
||||||
|
'бол': 20,
|
||||||
|
'ол ': 21,
|
||||||
|
'н б': 22,
|
||||||
|
'оло': 23,
|
||||||
|
' хэ': 24,
|
||||||
|
'онг': 25,
|
||||||
|
'гол': 26,
|
||||||
|
'гуу': 27,
|
||||||
|
'нго': 28,
|
||||||
|
'ыг ': 29,
|
||||||
|
'жил': 30,
|
||||||
|
' мо': 31,
|
||||||
|
'лаг': 32,
|
||||||
|
'лла': 33,
|
||||||
|
'мон': 34,
|
||||||
|
' тє': 35,
|
||||||
|
' ху': 36,
|
||||||
|
'айд': 37,
|
||||||
|
'ны ': 38,
|
||||||
|
'он ': 39,
|
||||||
|
'сан': 40,
|
||||||
|
'хий': 41,
|
||||||
|
' аж': 42,
|
||||||
|
' ор': 43,
|
||||||
|
'л у': 44,
|
||||||
|
'н т': 45,
|
||||||
|
'улг': 46,
|
||||||
|
'айг': 47,
|
||||||
|
'длы': 48,
|
||||||
|
'йг ': 49,
|
||||||
|
' за': 50,
|
||||||
|
'дэс': 51,
|
||||||
|
'н а': 52,
|
||||||
|
'ндэ': 53,
|
||||||
|
'ула': 54,
|
||||||
|
'ээ ': 55,
|
||||||
|
'ага': 56,
|
||||||
|
'ийг': 57,
|
||||||
|
'vй ': 58,
|
||||||
|
'аа ': 59,
|
||||||
|
'й а': 60,
|
||||||
|
'лын': 61,
|
||||||
|
'н з': 62,
|
||||||
|
' аю': 63,
|
||||||
|
' зє': 64,
|
||||||
|
'аар': 65,
|
||||||
|
'ад ': 66,
|
||||||
|
'ар ': 67,
|
||||||
|
'гvй': 68,
|
||||||
|
'зєв': 69,
|
||||||
|
'ажи': 70,
|
||||||
|
'ал ': 71,
|
||||||
|
'аюу': 72,
|
||||||
|
'г х': 73,
|
||||||
|
'лгv': 74,
|
||||||
|
'лж ': 75,
|
||||||
|
'сни': 76,
|
||||||
|
'эсн': 77,
|
||||||
|
'юул': 78,
|
||||||
|
'йдл': 79,
|
||||||
|
'лыг': 80,
|
||||||
|
'нхи': 81,
|
||||||
|
'ууд': 82,
|
||||||
|
'хам': 83,
|
||||||
|
' нэ': 84,
|
||||||
|
' са': 85,
|
||||||
|
'гий': 86,
|
||||||
|
'лах': 87,
|
||||||
|
'лєл': 88,
|
||||||
|
'рєн': 89,
|
||||||
|
'єгч': 90,
|
||||||
|
' та': 91,
|
||||||
|
'илл': 92,
|
||||||
|
'лий': 93,
|
||||||
|
'лэх': 94,
|
||||||
|
'рий': 95,
|
||||||
|
'эх ': 96,
|
||||||
|
' ер': 97,
|
||||||
|
' эр': 98,
|
||||||
|
'влє': 99,
|
||||||
|
'ерє': 100,
|
||||||
|
'ийл': 101,
|
||||||
|
'лон': 102,
|
||||||
|
'лєг': 103,
|
||||||
|
'євл': 104,
|
||||||
|
'єнх': 105,
|
||||||
|
' хо': 106,
|
||||||
|
'ари': 107,
|
||||||
|
'их ': 108,
|
||||||
|
'хан': 109,
|
||||||
|
'эр ': 110,
|
||||||
|
'єн ': 111,
|
||||||
|
'vvл': 112,
|
||||||
|
'ж б': 113,
|
||||||
|
'тэй': 114,
|
||||||
|
'х х': 115,
|
||||||
|
'эрх': 116,
|
||||||
|
' vн': 117,
|
||||||
|
' нь': 118,
|
||||||
|
'vнд': 119,
|
||||||
|
'алт': 120,
|
||||||
|
'йлє': 121,
|
||||||
|
'нь ': 122,
|
||||||
|
'тєр': 123,
|
||||||
|
' га': 124,
|
||||||
|
' су': 125,
|
||||||
|
'аан': 126,
|
||||||
|
'даа': 127,
|
||||||
|
'илц': 128,
|
||||||
|
'йгу': 129,
|
||||||
|
'л а': 130,
|
||||||
|
'лаа': 131,
|
||||||
|
'н н': 132,
|
||||||
|
'руу': 133,
|
||||||
|
'эй ': 134,
|
||||||
|
' то': 135,
|
||||||
|
'н с': 136,
|
||||||
|
'рил': 137,
|
||||||
|
'єри': 138,
|
||||||
|
'ааг': 139,
|
||||||
|
'гч ': 140,
|
||||||
|
'лээ': 141,
|
||||||
|
'н о': 142,
|
||||||
|
'рэг': 143,
|
||||||
|
'суу': 144,
|
||||||
|
'эрэ': 145,
|
||||||
|
'їїл': 146,
|
||||||
|
' yн': 147,
|
||||||
|
' бу': 148,
|
||||||
|
' дэ': 149,
|
||||||
|
' ол': 150,
|
||||||
|
' ту': 151,
|
||||||
|
' ши': 152,
|
||||||
|
'yнд': 153,
|
||||||
|
'аши': 154,
|
||||||
|
'г т': 155,
|
||||||
|
'иг ': 156,
|
||||||
|
'йл ': 157,
|
||||||
|
'хар': 158,
|
||||||
|
'шин': 159,
|
||||||
|
'эг ': 160,
|
||||||
|
'єр ': 161,
|
||||||
|
' их': 162,
|
||||||
|
' хє': 163,
|
||||||
|
' хї': 164,
|
||||||
|
'ам ': 165,
|
||||||
|
'анг': 166,
|
||||||
|
'ин ': 167,
|
||||||
|
'йга': 168,
|
||||||
|
'лса': 169,
|
||||||
|
'н v': 170,
|
||||||
|
'н е': 171,
|
||||||
|
'нал': 172,
|
||||||
|
'нд ': 173,
|
||||||
|
'хуу': 174,
|
||||||
|
'цаа': 175,
|
||||||
|
'эд ': 176,
|
||||||
|
'ээр': 177,
|
||||||
|
'єл ': 178,
|
||||||
|
'vйл': 179,
|
||||||
|
'ада': 180,
|
||||||
|
'айн': 181,
|
||||||
|
'ала': 182,
|
||||||
|
'амт': 183,
|
||||||
|
'гах': 184,
|
||||||
|
'д х': 185,
|
||||||
|
'дал': 186,
|
||||||
|
'зар': 187,
|
||||||
|
'л б': 188,
|
||||||
|
'лан': 189,
|
||||||
|
'н д': 190,
|
||||||
|
'сэн': 191,
|
||||||
|
'улл': 192,
|
||||||
|
'х б': 193,
|
||||||
|
'хэр': 194,
|
||||||
|
' бv': 195,
|
||||||
|
' да': 196,
|
||||||
|
' зо': 197,
|
||||||
|
'vрэ': 198,
|
||||||
|
'аад': 199,
|
||||||
|
'гээ': 200,
|
||||||
|
'лэн': 201,
|
||||||
|
'н и': 202,
|
||||||
|
'н э': 203,
|
||||||
|
'нга': 204,
|
||||||
|
'нэ ': 205,
|
||||||
|
'тал': 206,
|
||||||
|
'тын': 207,
|
||||||
|
'хур': 208,
|
||||||
|
'эл ': 209,
|
||||||
|
' на': 210,
|
||||||
|
' ни': 211,
|
||||||
|
' он': 212,
|
||||||
|
'vлэ': 213,
|
||||||
|
'аг ': 214,
|
||||||
|
'аж ': 215,
|
||||||
|
'ай ': 216,
|
||||||
|
'ата': 217,
|
||||||
|
'бар': 218,
|
||||||
|
'г б': 219,
|
||||||
|
'гад': 220,
|
||||||
|
'гїй': 221,
|
||||||
|
'й х': 222,
|
||||||
|
'лт ': 223,
|
||||||
|
'н м': 224,
|
||||||
|
'на ': 225,
|
||||||
|
'оро': 226,
|
||||||
|
'уль': 227,
|
||||||
|
'чин': 228,
|
||||||
|
'эж ': 229,
|
||||||
|
'энэ': 230,
|
||||||
|
'ээд': 231,
|
||||||
|
'їй ': 232,
|
||||||
|
'їлэ': 233,
|
||||||
|
' би': 234,
|
||||||
|
' тэ': 235,
|
||||||
|
' эн': 236,
|
||||||
|
'аны': 237,
|
||||||
|
'дий': 238,
|
||||||
|
'дээ': 239,
|
||||||
|
'лал': 240,
|
||||||
|
'лга': 241,
|
||||||
|
'лд ': 242,
|
||||||
|
'лог': 243,
|
||||||
|
'ль ': 244,
|
||||||
|
'н у': 245,
|
||||||
|
'н ї': 246,
|
||||||
|
'р б': 247,
|
||||||
|
'рал': 248,
|
||||||
|
'сон': 249,
|
||||||
|
'тай': 250,
|
||||||
|
'удл': 251,
|
||||||
|
'элт': 252,
|
||||||
|
'эрг': 253,
|
||||||
|
'єлє': 254,
|
||||||
|
' vй': 255,
|
||||||
|
' в ': 256,
|
||||||
|
' гэ': 257,
|
||||||
|
' хv': 258,
|
||||||
|
'ара': 259,
|
||||||
|
'бvр': 260,
|
||||||
|
'д н': 261,
|
||||||
|
'д о': 262,
|
||||||
|
'л х': 263,
|
||||||
|
'лс ': 264,
|
||||||
|
'лты': 265,
|
||||||
|
'н г': 266,
|
||||||
|
'нэг': 267,
|
||||||
|
'огт': 268,
|
||||||
|
'олы': 269,
|
||||||
|
'оёр': 270,
|
||||||
|
'р т': 271,
|
||||||
|
'рээ': 272,
|
||||||
|
'тав': 273,
|
||||||
|
'тог': 274,
|
||||||
|
'уур': 275,
|
||||||
|
'хоё': 276,
|
||||||
|
'хэл': 277,
|
||||||
|
'хээ': 278,
|
||||||
|
'элэ': 279,
|
||||||
|
'ёр ': 280,
|
||||||
|
' ав': 281,
|
||||||
|
' ас': 282,
|
||||||
|
' аш': 283,
|
||||||
|
' ду': 284,
|
||||||
|
' со': 285,
|
||||||
|
' чи': 286,
|
||||||
|
' эв': 287,
|
||||||
|
' єр': 288,
|
||||||
|
'аал': 289,
|
||||||
|
'алд': 290,
|
||||||
|
'амж': 291,
|
||||||
|
'анд': 292,
|
||||||
|
'асу': 293,
|
||||||
|
'вэр': 294,
|
||||||
|
'г у': 295,
|
||||||
|
'двэ': 296,
|
||||||
|
'жvv': 297,
|
||||||
|
'лца': 298,
|
||||||
|
'лэл': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/nb.py
Normal file
303
libs/guess_language/data/models/nb.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'er ': 0,
|
||||||
|
'en ': 1,
|
||||||
|
'et ': 2,
|
||||||
|
' de': 3,
|
||||||
|
'det': 4,
|
||||||
|
' i ': 5,
|
||||||
|
'for': 6,
|
||||||
|
'il ': 7,
|
||||||
|
' fo': 8,
|
||||||
|
' me': 9,
|
||||||
|
'ing': 10,
|
||||||
|
'om ': 11,
|
||||||
|
' ha': 12,
|
||||||
|
' og': 13,
|
||||||
|
'ter': 14,
|
||||||
|
' er': 15,
|
||||||
|
' ti': 16,
|
||||||
|
' st': 17,
|
||||||
|
'og ': 18,
|
||||||
|
'til': 19,
|
||||||
|
'ne ': 20,
|
||||||
|
' vi': 21,
|
||||||
|
're ': 22,
|
||||||
|
' en': 23,
|
||||||
|
' se': 24,
|
||||||
|
'te ': 25,
|
||||||
|
'or ': 26,
|
||||||
|
'de ': 27,
|
||||||
|
'kke': 28,
|
||||||
|
'ke ': 29,
|
||||||
|
'ar ': 30,
|
||||||
|
'ng ': 31,
|
||||||
|
'r s': 32,
|
||||||
|
'ene': 33,
|
||||||
|
' so': 34,
|
||||||
|
'e s': 35,
|
||||||
|
'der': 36,
|
||||||
|
'an ': 37,
|
||||||
|
'som': 38,
|
||||||
|
'ste': 39,
|
||||||
|
'at ': 40,
|
||||||
|
'ed ': 41,
|
||||||
|
'r i': 42,
|
||||||
|
' av': 43,
|
||||||
|
' in': 44,
|
||||||
|
'men': 45,
|
||||||
|
' at': 46,
|
||||||
|
' ko': 47,
|
||||||
|
' på': 48,
|
||||||
|
'har': 49,
|
||||||
|
' si': 50,
|
||||||
|
'ere': 51,
|
||||||
|
'på ': 52,
|
||||||
|
'nde': 53,
|
||||||
|
'and': 54,
|
||||||
|
'els': 55,
|
||||||
|
'ett': 56,
|
||||||
|
'tte': 57,
|
||||||
|
'lig': 58,
|
||||||
|
't s': 59,
|
||||||
|
'den': 60,
|
||||||
|
't i': 61,
|
||||||
|
'ikk': 62,
|
||||||
|
'med': 63,
|
||||||
|
'n s': 64,
|
||||||
|
'rt ': 65,
|
||||||
|
'ser': 66,
|
||||||
|
'ska': 67,
|
||||||
|
't e': 68,
|
||||||
|
'ker': 69,
|
||||||
|
'sen': 70,
|
||||||
|
'av ': 71,
|
||||||
|
'ler': 72,
|
||||||
|
'r a': 73,
|
||||||
|
'ten': 74,
|
||||||
|
'e f': 75,
|
||||||
|
'r e': 76,
|
||||||
|
'r t': 77,
|
||||||
|
'ede': 78,
|
||||||
|
'ig ': 79,
|
||||||
|
' re': 80,
|
||||||
|
'han': 81,
|
||||||
|
'lle': 82,
|
||||||
|
'ner': 83,
|
||||||
|
' bl': 84,
|
||||||
|
' fr': 85,
|
||||||
|
'le ': 86,
|
||||||
|
' ve': 87,
|
||||||
|
'e t': 88,
|
||||||
|
'lan': 89,
|
||||||
|
'mme': 90,
|
||||||
|
'nge': 91,
|
||||||
|
' be': 92,
|
||||||
|
' ik': 93,
|
||||||
|
' om': 94,
|
||||||
|
' å ': 95,
|
||||||
|
'ell': 96,
|
||||||
|
'sel': 97,
|
||||||
|
'sta': 98,
|
||||||
|
'ver': 99,
|
||||||
|
' et': 100,
|
||||||
|
' sk': 101,
|
||||||
|
'nte': 102,
|
||||||
|
'one': 103,
|
||||||
|
'ore': 104,
|
||||||
|
'r d': 105,
|
||||||
|
'ske': 106,
|
||||||
|
' an': 107,
|
||||||
|
' la': 108,
|
||||||
|
'del': 109,
|
||||||
|
'gen': 110,
|
||||||
|
'nin': 111,
|
||||||
|
'r f': 112,
|
||||||
|
'r v': 113,
|
||||||
|
'se ': 114,
|
||||||
|
' po': 115,
|
||||||
|
'ir ': 116,
|
||||||
|
'jon': 117,
|
||||||
|
'mer': 118,
|
||||||
|
'nen': 119,
|
||||||
|
'omm': 120,
|
||||||
|
'sjo': 121,
|
||||||
|
' fl': 122,
|
||||||
|
' sa': 123,
|
||||||
|
'ern': 124,
|
||||||
|
'kom': 125,
|
||||||
|
'r m': 126,
|
||||||
|
'r o': 127,
|
||||||
|
'ren': 128,
|
||||||
|
'vil': 129,
|
||||||
|
'ale': 130,
|
||||||
|
'es ': 131,
|
||||||
|
'n a': 132,
|
||||||
|
't f': 133,
|
||||||
|
' le': 134,
|
||||||
|
'bli': 135,
|
||||||
|
'e e': 136,
|
||||||
|
'e i': 137,
|
||||||
|
'e v': 138,
|
||||||
|
'het': 139,
|
||||||
|
'ye ': 140,
|
||||||
|
' ir': 141,
|
||||||
|
'al ': 142,
|
||||||
|
'e o': 143,
|
||||||
|
'ide': 144,
|
||||||
|
'iti': 145,
|
||||||
|
'lit': 146,
|
||||||
|
'nne': 147,
|
||||||
|
'ran': 148,
|
||||||
|
't o': 149,
|
||||||
|
'tal': 150,
|
||||||
|
'tat': 151,
|
||||||
|
'tt ': 152,
|
||||||
|
' ka': 153,
|
||||||
|
'ans': 154,
|
||||||
|
'asj': 155,
|
||||||
|
'ge ': 156,
|
||||||
|
'inn': 157,
|
||||||
|
'kon': 158,
|
||||||
|
'lse': 159,
|
||||||
|
'pet': 160,
|
||||||
|
't d': 161,
|
||||||
|
'vi ': 162,
|
||||||
|
' ut': 163,
|
||||||
|
'ent': 164,
|
||||||
|
'eri': 165,
|
||||||
|
'oli': 166,
|
||||||
|
'r p': 167,
|
||||||
|
'ret': 168,
|
||||||
|
'ris': 169,
|
||||||
|
'sto': 170,
|
||||||
|
'str': 171,
|
||||||
|
't a': 172,
|
||||||
|
' ga': 173,
|
||||||
|
'all': 174,
|
||||||
|
'ape': 175,
|
||||||
|
'g s': 176,
|
||||||
|
'ill': 177,
|
||||||
|
'ira': 178,
|
||||||
|
'kap': 179,
|
||||||
|
'nn ': 180,
|
||||||
|
'opp': 181,
|
||||||
|
'r h': 182,
|
||||||
|
'rin': 183,
|
||||||
|
' br': 184,
|
||||||
|
' op': 185,
|
||||||
|
'e m': 186,
|
||||||
|
'ert': 187,
|
||||||
|
'ger': 188,
|
||||||
|
'ion': 189,
|
||||||
|
'kal': 190,
|
||||||
|
'lsk': 191,
|
||||||
|
'nes': 192,
|
||||||
|
' gj': 193,
|
||||||
|
' mi': 194,
|
||||||
|
' pr': 195,
|
||||||
|
'ang': 196,
|
||||||
|
'e h': 197,
|
||||||
|
'e r': 198,
|
||||||
|
'elt': 199,
|
||||||
|
'enn': 200,
|
||||||
|
'i s': 201,
|
||||||
|
'ist': 202,
|
||||||
|
'jen': 203,
|
||||||
|
'kan': 204,
|
||||||
|
'lt ': 205,
|
||||||
|
'nal': 206,
|
||||||
|
'res': 207,
|
||||||
|
'tor': 208,
|
||||||
|
'ass': 209,
|
||||||
|
'dre': 210,
|
||||||
|
'e b': 211,
|
||||||
|
'e p': 212,
|
||||||
|
'mel': 213,
|
||||||
|
'n t': 214,
|
||||||
|
'nse': 215,
|
||||||
|
'ort': 216,
|
||||||
|
'per': 217,
|
||||||
|
'reg': 218,
|
||||||
|
'sje': 219,
|
||||||
|
't p': 220,
|
||||||
|
't v': 221,
|
||||||
|
' hv': 222,
|
||||||
|
' nå': 223,
|
||||||
|
' va': 224,
|
||||||
|
'ann': 225,
|
||||||
|
'ato': 226,
|
||||||
|
'e a': 227,
|
||||||
|
'est': 228,
|
||||||
|
'ise': 229,
|
||||||
|
'isk': 230,
|
||||||
|
'oil': 231,
|
||||||
|
'ord': 232,
|
||||||
|
'pol': 233,
|
||||||
|
'ra ': 234,
|
||||||
|
'rak': 235,
|
||||||
|
'sse': 236,
|
||||||
|
'toi': 237,
|
||||||
|
' gr': 238,
|
||||||
|
'ak ': 239,
|
||||||
|
'eg ': 240,
|
||||||
|
'ele': 241,
|
||||||
|
'g a': 242,
|
||||||
|
'ige': 243,
|
||||||
|
'igh': 244,
|
||||||
|
'm e': 245,
|
||||||
|
'n f': 246,
|
||||||
|
'n v': 247,
|
||||||
|
'ndr': 248,
|
||||||
|
'nsk': 249,
|
||||||
|
'rer': 250,
|
||||||
|
't m': 251,
|
||||||
|
'und': 252,
|
||||||
|
'var': 253,
|
||||||
|
'år ': 254,
|
||||||
|
' he': 255,
|
||||||
|
' no': 256,
|
||||||
|
' ny': 257,
|
||||||
|
'end': 258,
|
||||||
|
'ete': 259,
|
||||||
|
'fly': 260,
|
||||||
|
'g i': 261,
|
||||||
|
'ghe': 262,
|
||||||
|
'ier': 263,
|
||||||
|
'ind': 264,
|
||||||
|
'int': 265,
|
||||||
|
'lin': 266,
|
||||||
|
'n d': 267,
|
||||||
|
'n p': 268,
|
||||||
|
'rne': 269,
|
||||||
|
'sak': 270,
|
||||||
|
'sie': 271,
|
||||||
|
't b': 272,
|
||||||
|
'tid': 273,
|
||||||
|
' al': 274,
|
||||||
|
' pa': 275,
|
||||||
|
' tr': 276,
|
||||||
|
'ag ': 277,
|
||||||
|
'dig': 278,
|
||||||
|
'e d': 279,
|
||||||
|
'e k': 280,
|
||||||
|
'ess': 281,
|
||||||
|
'hol': 282,
|
||||||
|
'i d': 283,
|
||||||
|
'lag': 284,
|
||||||
|
'led': 285,
|
||||||
|
'n e': 286,
|
||||||
|
'n i': 287,
|
||||||
|
'n o': 288,
|
||||||
|
'pri': 289,
|
||||||
|
'r b': 290,
|
||||||
|
'st ': 291,
|
||||||
|
' fe': 292,
|
||||||
|
' li': 293,
|
||||||
|
' ry': 294,
|
||||||
|
'air': 295,
|
||||||
|
'ake': 296,
|
||||||
|
'd s': 297,
|
||||||
|
'eas': 298,
|
||||||
|
'egi': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/ne.py
Normal file
303
libs/guess_language/data/models/ne.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'को ': 0,
|
||||||
|
'का ': 1,
|
||||||
|
'मा ': 2,
|
||||||
|
'हरु': 3,
|
||||||
|
' ने': 4,
|
||||||
|
'नेप': 5,
|
||||||
|
'पाल': 6,
|
||||||
|
'ेपा': 7,
|
||||||
|
' सम': 8,
|
||||||
|
'ले ': 9,
|
||||||
|
' प्': 10,
|
||||||
|
'प्र': 11,
|
||||||
|
'कार': 12,
|
||||||
|
'ा स': 13,
|
||||||
|
'एको': 14,
|
||||||
|
' भए': 15,
|
||||||
|
' छ ': 16,
|
||||||
|
' भा': 17,
|
||||||
|
'्रम': 18,
|
||||||
|
' गर': 19,
|
||||||
|
'रुक': 20,
|
||||||
|
' र ': 21,
|
||||||
|
'भार': 22,
|
||||||
|
'ारत': 23,
|
||||||
|
' का': 24,
|
||||||
|
' वि': 25,
|
||||||
|
'भएक': 26,
|
||||||
|
'ाली': 27,
|
||||||
|
'ली ': 28,
|
||||||
|
'ा प': 29,
|
||||||
|
'ीहर': 30,
|
||||||
|
'ार्': 31,
|
||||||
|
'ो छ': 32,
|
||||||
|
'ना ': 33,
|
||||||
|
'रु ': 34,
|
||||||
|
'ालक': 35,
|
||||||
|
'्या': 36,
|
||||||
|
' बा': 37,
|
||||||
|
'एका': 38,
|
||||||
|
'ने ': 39,
|
||||||
|
'न्त': 40,
|
||||||
|
'ा ब': 41,
|
||||||
|
'ाको': 42,
|
||||||
|
'ार ': 43,
|
||||||
|
'ा भ': 44,
|
||||||
|
'ाहर': 45,
|
||||||
|
'्रो': 46,
|
||||||
|
'क्ष': 47,
|
||||||
|
'न् ': 48,
|
||||||
|
'ारी': 49,
|
||||||
|
' नि': 50,
|
||||||
|
'ा न': 51,
|
||||||
|
'ी स': 52,
|
||||||
|
' डु': 53,
|
||||||
|
'क्र': 54,
|
||||||
|
'जना': 55,
|
||||||
|
'यो ': 56,
|
||||||
|
'ा छ': 57,
|
||||||
|
'ेवा': 58,
|
||||||
|
'्ता': 59,
|
||||||
|
' रा': 60,
|
||||||
|
'त्य': 61,
|
||||||
|
'न्द': 62,
|
||||||
|
'हुन': 63,
|
||||||
|
'ा क': 64,
|
||||||
|
'ामा': 65,
|
||||||
|
'ी न': 66,
|
||||||
|
'्दा': 67,
|
||||||
|
' से': 68,
|
||||||
|
'छन्': 69,
|
||||||
|
'म्ब': 70,
|
||||||
|
'रोत': 71,
|
||||||
|
'सेव': 72,
|
||||||
|
'स्त': 73,
|
||||||
|
'स्र': 74,
|
||||||
|
'ेका': 75,
|
||||||
|
'्त ': 76,
|
||||||
|
' बी': 77,
|
||||||
|
' हु': 78,
|
||||||
|
'क्त': 79,
|
||||||
|
'त्र': 80,
|
||||||
|
'रत ': 81,
|
||||||
|
'र्न': 82,
|
||||||
|
'र्य': 83,
|
||||||
|
'ा र': 84,
|
||||||
|
'ाका': 85,
|
||||||
|
'ुको': 86,
|
||||||
|
' एक': 87,
|
||||||
|
' सं': 88,
|
||||||
|
' सु': 89,
|
||||||
|
'बीब': 90,
|
||||||
|
'बीस': 91,
|
||||||
|
'लको': 92,
|
||||||
|
'स्य': 93,
|
||||||
|
'ीबी': 94,
|
||||||
|
'ीसी': 95,
|
||||||
|
'ेको': 96,
|
||||||
|
'ो स': 97,
|
||||||
|
'्यक': 98,
|
||||||
|
' छन': 99,
|
||||||
|
' जन': 100,
|
||||||
|
' बि': 101,
|
||||||
|
' मु': 102,
|
||||||
|
' स्': 103,
|
||||||
|
'गर्': 104,
|
||||||
|
'ताह': 105,
|
||||||
|
'न्ध': 106,
|
||||||
|
'बार': 107,
|
||||||
|
'मन्': 108,
|
||||||
|
'मस्': 109,
|
||||||
|
'रुल': 110,
|
||||||
|
'लाई': 111,
|
||||||
|
'ा व': 112,
|
||||||
|
'ाई ': 113,
|
||||||
|
'ाल ': 114,
|
||||||
|
'िका': 115,
|
||||||
|
' त्': 116,
|
||||||
|
' मा': 117,
|
||||||
|
' यस': 118,
|
||||||
|
' रु': 119,
|
||||||
|
'ताक': 120,
|
||||||
|
'बन्': 121,
|
||||||
|
'र ब': 122,
|
||||||
|
'रण ': 123,
|
||||||
|
'रुप': 124,
|
||||||
|
'रेक': 125,
|
||||||
|
'ष्ट': 126,
|
||||||
|
'सम्': 127,
|
||||||
|
'सी ': 128,
|
||||||
|
'ाएक': 129,
|
||||||
|
'ुका': 130,
|
||||||
|
'ुक्': 131,
|
||||||
|
' अध': 132,
|
||||||
|
' अन': 133,
|
||||||
|
' तथ': 134,
|
||||||
|
' थि': 135,
|
||||||
|
' दे': 136,
|
||||||
|
' पर': 137,
|
||||||
|
' बै': 138,
|
||||||
|
'तथा': 139,
|
||||||
|
'ता ': 140,
|
||||||
|
'दा ': 141,
|
||||||
|
'द्द': 142,
|
||||||
|
'नी ': 143,
|
||||||
|
'बाट': 144,
|
||||||
|
'यक्': 145,
|
||||||
|
'री ': 146,
|
||||||
|
'रीह': 147,
|
||||||
|
'र्म': 148,
|
||||||
|
'लका': 149,
|
||||||
|
'समस': 150,
|
||||||
|
'ा अ': 151,
|
||||||
|
'ा ए': 152,
|
||||||
|
'ाट ': 153,
|
||||||
|
'िय ': 154,
|
||||||
|
'ो प': 155,
|
||||||
|
'ो म': 156,
|
||||||
|
'्न ': 157,
|
||||||
|
'्ने': 158,
|
||||||
|
'्षा': 159,
|
||||||
|
' पा': 160,
|
||||||
|
' यो': 161,
|
||||||
|
' हा': 162,
|
||||||
|
'अधि': 163,
|
||||||
|
'डुव': 164,
|
||||||
|
'त भ': 165,
|
||||||
|
'त स': 166,
|
||||||
|
'था ': 167,
|
||||||
|
'धिक': 168,
|
||||||
|
'पमा': 169,
|
||||||
|
'बैठ': 170,
|
||||||
|
'मुद': 171,
|
||||||
|
'या ': 172,
|
||||||
|
'युक': 173,
|
||||||
|
'र न': 174,
|
||||||
|
'रति': 175,
|
||||||
|
'वान': 176,
|
||||||
|
'सार': 177,
|
||||||
|
'ा आ': 178,
|
||||||
|
'ा ज': 179,
|
||||||
|
'ा ह': 180,
|
||||||
|
'ुद्': 181,
|
||||||
|
'ुपम': 182,
|
||||||
|
'ुले': 183,
|
||||||
|
'ुवा': 184,
|
||||||
|
'ैठक': 185,
|
||||||
|
'ो ब': 186,
|
||||||
|
'्तर': 187,
|
||||||
|
'्य ': 188,
|
||||||
|
'्यस': 189,
|
||||||
|
' क्': 190,
|
||||||
|
' मन': 191,
|
||||||
|
' रह': 192,
|
||||||
|
'चार': 193,
|
||||||
|
'तिय': 194,
|
||||||
|
'दै ': 195,
|
||||||
|
'निर': 196,
|
||||||
|
'नु ': 197,
|
||||||
|
'पर्': 198,
|
||||||
|
'रक्': 199,
|
||||||
|
'र्द': 200,
|
||||||
|
'समा': 201,
|
||||||
|
'सुर': 202,
|
||||||
|
'ाउन': 203,
|
||||||
|
'ान ': 204,
|
||||||
|
'ानम': 205,
|
||||||
|
'ारण': 206,
|
||||||
|
'ाले': 207,
|
||||||
|
'ि ब': 208,
|
||||||
|
'ियो': 209,
|
||||||
|
'ुन्': 210,
|
||||||
|
'ुरक': 211,
|
||||||
|
'्त्': 212,
|
||||||
|
'्बन': 213,
|
||||||
|
'्रा': 214,
|
||||||
|
'्ष ': 215,
|
||||||
|
' आर': 216,
|
||||||
|
' जल': 217,
|
||||||
|
' बे': 218,
|
||||||
|
' या': 219,
|
||||||
|
' सा': 220,
|
||||||
|
'आएक': 221,
|
||||||
|
'एक ': 222,
|
||||||
|
'कर्': 223,
|
||||||
|
'जलस': 224,
|
||||||
|
'णका': 225,
|
||||||
|
'त र': 226,
|
||||||
|
'द्र': 227,
|
||||||
|
'धान': 228,
|
||||||
|
'धि ': 229,
|
||||||
|
'नका': 230,
|
||||||
|
'नमा': 231,
|
||||||
|
'नि ': 232,
|
||||||
|
'ममा': 233,
|
||||||
|
'रम ': 234,
|
||||||
|
'रहे': 235,
|
||||||
|
'राज': 236,
|
||||||
|
'लस्': 237,
|
||||||
|
'ला ': 238,
|
||||||
|
'वार': 239,
|
||||||
|
'सका': 240,
|
||||||
|
'हिल': 241,
|
||||||
|
'हेक': 242,
|
||||||
|
'ा त': 243,
|
||||||
|
'ारे': 244,
|
||||||
|
'िन्': 245,
|
||||||
|
'िस्': 246,
|
||||||
|
'े स': 247,
|
||||||
|
'ो न': 248,
|
||||||
|
'ो र': 249,
|
||||||
|
'ोत ': 250,
|
||||||
|
'्धि': 251,
|
||||||
|
'्मी': 252,
|
||||||
|
'्रस': 253,
|
||||||
|
' दु': 254,
|
||||||
|
' पन': 255,
|
||||||
|
' बत': 256,
|
||||||
|
' बन': 257,
|
||||||
|
' भन': 258,
|
||||||
|
'ंयु': 259,
|
||||||
|
'आरम': 260,
|
||||||
|
'खि ': 261,
|
||||||
|
'ण्ड': 262,
|
||||||
|
'तका': 263,
|
||||||
|
'ताल': 264,
|
||||||
|
'दी ': 265,
|
||||||
|
'देख': 266,
|
||||||
|
'निय': 267,
|
||||||
|
'पनि': 268,
|
||||||
|
'प्त': 269,
|
||||||
|
'बता': 270,
|
||||||
|
'मी ': 271,
|
||||||
|
'म्भ': 272,
|
||||||
|
'र स': 273,
|
||||||
|
'रम्': 274,
|
||||||
|
'लमा': 275,
|
||||||
|
'विश': 276,
|
||||||
|
'षाक': 277,
|
||||||
|
'संय': 278,
|
||||||
|
'ा ड': 279,
|
||||||
|
'ा म': 280,
|
||||||
|
'ानक': 281,
|
||||||
|
'ालम': 282,
|
||||||
|
'ि भ': 283,
|
||||||
|
'ित ': 284,
|
||||||
|
'ी प': 285,
|
||||||
|
'ी र': 286,
|
||||||
|
'ु भ': 287,
|
||||||
|
'ुने': 288,
|
||||||
|
'े ग': 289,
|
||||||
|
'ेखि': 290,
|
||||||
|
'ेर ': 291,
|
||||||
|
'ो भ': 292,
|
||||||
|
'ो व': 293,
|
||||||
|
'ो ह': 294,
|
||||||
|
'्भ ': 295,
|
||||||
|
'्र ': 296,
|
||||||
|
' ता': 297,
|
||||||
|
' नम': 298,
|
||||||
|
' ना': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/nl.py
Normal file
303
libs/guess_language/data/models/nl.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'en ': 0,
|
||||||
|
'de ': 1,
|
||||||
|
' de': 2,
|
||||||
|
'et ': 3,
|
||||||
|
'an ': 4,
|
||||||
|
' he': 5,
|
||||||
|
'er ': 6,
|
||||||
|
' va': 7,
|
||||||
|
'n d': 8,
|
||||||
|
'van': 9,
|
||||||
|
'een': 10,
|
||||||
|
'het': 11,
|
||||||
|
' ge': 12,
|
||||||
|
'oor': 13,
|
||||||
|
' ee': 14,
|
||||||
|
'der': 15,
|
||||||
|
' en': 16,
|
||||||
|
'ij ': 17,
|
||||||
|
'aar': 18,
|
||||||
|
'gen': 19,
|
||||||
|
'te ': 20,
|
||||||
|
'ver': 21,
|
||||||
|
' in': 22,
|
||||||
|
' me': 23,
|
||||||
|
'aan': 24,
|
||||||
|
'den': 25,
|
||||||
|
' we': 26,
|
||||||
|
'at ': 27,
|
||||||
|
'in ': 28,
|
||||||
|
' da': 29,
|
||||||
|
' te': 30,
|
||||||
|
'eer': 31,
|
||||||
|
'nde': 32,
|
||||||
|
'ter': 33,
|
||||||
|
'ste': 34,
|
||||||
|
'n v': 35,
|
||||||
|
' vo': 36,
|
||||||
|
' zi': 37,
|
||||||
|
'ing': 38,
|
||||||
|
'n h': 39,
|
||||||
|
'voo': 40,
|
||||||
|
'is ': 41,
|
||||||
|
' op': 42,
|
||||||
|
'tie': 43,
|
||||||
|
' aa': 44,
|
||||||
|
'ede': 45,
|
||||||
|
'erd': 46,
|
||||||
|
'ers': 47,
|
||||||
|
' be': 48,
|
||||||
|
'eme': 49,
|
||||||
|
'ten': 50,
|
||||||
|
'ken': 51,
|
||||||
|
'n e': 52,
|
||||||
|
' ni': 53,
|
||||||
|
' ve': 54,
|
||||||
|
'ent': 55,
|
||||||
|
'ijn': 56,
|
||||||
|
'jn ': 57,
|
||||||
|
'mee': 58,
|
||||||
|
'iet': 59,
|
||||||
|
'n w': 60,
|
||||||
|
'ng ': 61,
|
||||||
|
'nie': 62,
|
||||||
|
' is': 63,
|
||||||
|
'cht': 64,
|
||||||
|
'dat': 65,
|
||||||
|
'ere': 66,
|
||||||
|
'ie ': 67,
|
||||||
|
'ijk': 68,
|
||||||
|
'n b': 69,
|
||||||
|
'rde': 70,
|
||||||
|
'ar ': 71,
|
||||||
|
'e b': 72,
|
||||||
|
'e a': 73,
|
||||||
|
'met': 74,
|
||||||
|
't d': 75,
|
||||||
|
'el ': 76,
|
||||||
|
'ond': 77,
|
||||||
|
't h': 78,
|
||||||
|
' al': 79,
|
||||||
|
'e w': 80,
|
||||||
|
'op ': 81,
|
||||||
|
'ren': 82,
|
||||||
|
' di': 83,
|
||||||
|
' on': 84,
|
||||||
|
'al ': 85,
|
||||||
|
'and': 86,
|
||||||
|
'bij': 87,
|
||||||
|
'zij': 88,
|
||||||
|
' bi': 89,
|
||||||
|
' hi': 90,
|
||||||
|
' wi': 91,
|
||||||
|
'or ': 92,
|
||||||
|
'r d': 93,
|
||||||
|
't v': 94,
|
||||||
|
' wa': 95,
|
||||||
|
'e h': 96,
|
||||||
|
'lle': 97,
|
||||||
|
'rt ': 98,
|
||||||
|
'ang': 99,
|
||||||
|
'hij': 100,
|
||||||
|
'men': 101,
|
||||||
|
'n a': 102,
|
||||||
|
'n z': 103,
|
||||||
|
'rs ': 104,
|
||||||
|
' om': 105,
|
||||||
|
'e o': 106,
|
||||||
|
'e v': 107,
|
||||||
|
'end': 108,
|
||||||
|
'est': 109,
|
||||||
|
'n t': 110,
|
||||||
|
'par': 111,
|
||||||
|
' pa': 112,
|
||||||
|
' pr': 113,
|
||||||
|
' ze': 114,
|
||||||
|
'e g': 115,
|
||||||
|
'e p': 116,
|
||||||
|
'n p': 117,
|
||||||
|
'ord': 118,
|
||||||
|
'oud': 119,
|
||||||
|
'raa': 120,
|
||||||
|
'sch': 121,
|
||||||
|
't e': 122,
|
||||||
|
'ege': 123,
|
||||||
|
'ich': 124,
|
||||||
|
'ien': 125,
|
||||||
|
'aat': 126,
|
||||||
|
'ek ': 127,
|
||||||
|
'len': 128,
|
||||||
|
'n m': 129,
|
||||||
|
'nge': 130,
|
||||||
|
'nt ': 131,
|
||||||
|
'ove': 132,
|
||||||
|
'rd ': 133,
|
||||||
|
'wer': 134,
|
||||||
|
' ma': 135,
|
||||||
|
' mi': 136,
|
||||||
|
'daa': 137,
|
||||||
|
'e k': 138,
|
||||||
|
'lij': 139,
|
||||||
|
'mer': 140,
|
||||||
|
'n g': 141,
|
||||||
|
'n o': 142,
|
||||||
|
'om ': 143,
|
||||||
|
'sen': 144,
|
||||||
|
't b': 145,
|
||||||
|
'wij': 146,
|
||||||
|
' ho': 147,
|
||||||
|
'e m': 148,
|
||||||
|
'ele': 149,
|
||||||
|
'gem': 150,
|
||||||
|
'heb': 151,
|
||||||
|
'pen': 152,
|
||||||
|
'ude': 153,
|
||||||
|
' bo': 154,
|
||||||
|
' ja': 155,
|
||||||
|
'die': 156,
|
||||||
|
'e e': 157,
|
||||||
|
'eli': 158,
|
||||||
|
'erk': 159,
|
||||||
|
'le ': 160,
|
||||||
|
'pro': 161,
|
||||||
|
'rij': 162,
|
||||||
|
' er': 163,
|
||||||
|
' za': 164,
|
||||||
|
'e d': 165,
|
||||||
|
'ens': 166,
|
||||||
|
'ind': 167,
|
||||||
|
'ke ': 168,
|
||||||
|
'n k': 169,
|
||||||
|
'nd ': 170,
|
||||||
|
'nen': 171,
|
||||||
|
'nte': 172,
|
||||||
|
'r h': 173,
|
||||||
|
's d': 174,
|
||||||
|
's e': 175,
|
||||||
|
't z': 176,
|
||||||
|
' b ': 177,
|
||||||
|
' co': 178,
|
||||||
|
' ik': 179,
|
||||||
|
' ko': 180,
|
||||||
|
' ov': 181,
|
||||||
|
'eke': 182,
|
||||||
|
'hou': 183,
|
||||||
|
'ik ': 184,
|
||||||
|
'iti': 185,
|
||||||
|
'lan': 186,
|
||||||
|
'ns ': 187,
|
||||||
|
't g': 188,
|
||||||
|
't m': 189,
|
||||||
|
' do': 190,
|
||||||
|
' le': 191,
|
||||||
|
' zo': 192,
|
||||||
|
'ams': 193,
|
||||||
|
'e z': 194,
|
||||||
|
'g v': 195,
|
||||||
|
'it ': 196,
|
||||||
|
'je ': 197,
|
||||||
|
'ls ': 198,
|
||||||
|
'maa': 199,
|
||||||
|
'n i': 200,
|
||||||
|
'nke': 201,
|
||||||
|
'rke': 202,
|
||||||
|
'uit': 203,
|
||||||
|
' ha': 204,
|
||||||
|
' ka': 205,
|
||||||
|
' mo': 206,
|
||||||
|
' re': 207,
|
||||||
|
' st': 208,
|
||||||
|
' to': 209,
|
||||||
|
'age': 210,
|
||||||
|
'als': 211,
|
||||||
|
'ark': 212,
|
||||||
|
'art': 213,
|
||||||
|
'ben': 214,
|
||||||
|
'e r': 215,
|
||||||
|
'e s': 216,
|
||||||
|
'ert': 217,
|
||||||
|
'eze': 218,
|
||||||
|
'ht ': 219,
|
||||||
|
'ijd': 220,
|
||||||
|
'lem': 221,
|
||||||
|
'r v': 222,
|
||||||
|
'rte': 223,
|
||||||
|
't p': 224,
|
||||||
|
'zeg': 225,
|
||||||
|
'zic': 226,
|
||||||
|
'aak': 227,
|
||||||
|
'aal': 228,
|
||||||
|
'ag ': 229,
|
||||||
|
'ale': 230,
|
||||||
|
'bbe': 231,
|
||||||
|
'ch ': 232,
|
||||||
|
'e t': 233,
|
||||||
|
'ebb': 234,
|
||||||
|
'erz': 235,
|
||||||
|
'ft ': 236,
|
||||||
|
'ge ': 237,
|
||||||
|
'led': 238,
|
||||||
|
'mst': 239,
|
||||||
|
'n n': 240,
|
||||||
|
'oek': 241,
|
||||||
|
'r i': 242,
|
||||||
|
't o': 243,
|
||||||
|
't w': 244,
|
||||||
|
'tel': 245,
|
||||||
|
'tte': 246,
|
||||||
|
'uur': 247,
|
||||||
|
'we ': 248,
|
||||||
|
'zit': 249,
|
||||||
|
' af': 250,
|
||||||
|
' li': 251,
|
||||||
|
' ui': 252,
|
||||||
|
'ak ': 253,
|
||||||
|
'all': 254,
|
||||||
|
'aut': 255,
|
||||||
|
'doo': 256,
|
||||||
|
'e i': 257,
|
||||||
|
'ene': 258,
|
||||||
|
'erg': 259,
|
||||||
|
'ete': 260,
|
||||||
|
'ges': 261,
|
||||||
|
'hee': 262,
|
||||||
|
'jaa': 263,
|
||||||
|
'jke': 264,
|
||||||
|
'kee': 265,
|
||||||
|
'kel': 266,
|
||||||
|
'kom': 267,
|
||||||
|
'lee': 268,
|
||||||
|
'moe': 269,
|
||||||
|
'n s': 270,
|
||||||
|
'ort': 271,
|
||||||
|
'rec': 272,
|
||||||
|
's o': 273,
|
||||||
|
's v': 274,
|
||||||
|
'teg': 275,
|
||||||
|
'tij': 276,
|
||||||
|
'ven': 277,
|
||||||
|
'waa': 278,
|
||||||
|
'wel': 279,
|
||||||
|
' an': 280,
|
||||||
|
' au': 281,
|
||||||
|
' bu': 282,
|
||||||
|
' gr': 283,
|
||||||
|
' pl': 284,
|
||||||
|
' ti': 285,
|
||||||
|
"'' ": 286,
|
||||||
|
'ade': 287,
|
||||||
|
'dag': 288,
|
||||||
|
'e l': 289,
|
||||||
|
'ech': 290,
|
||||||
|
'eel': 291,
|
||||||
|
'eft': 292,
|
||||||
|
'ger': 293,
|
||||||
|
'gt ': 294,
|
||||||
|
'ig ': 295,
|
||||||
|
'itt': 296,
|
||||||
|
'j d': 297,
|
||||||
|
'ppe': 298,
|
||||||
|
'rda': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/nr.py
Normal file
303
libs/guess_language/data/models/nr.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'oku': 0,
|
||||||
|
'la ': 1,
|
||||||
|
'nga': 2,
|
||||||
|
'a n': 3,
|
||||||
|
' ng': 4,
|
||||||
|
'na ': 5,
|
||||||
|
'ama': 6,
|
||||||
|
'a i': 7,
|
||||||
|
'ko ': 8,
|
||||||
|
' uk': 9,
|
||||||
|
'ele': 10,
|
||||||
|
'lo ': 11,
|
||||||
|
'ela': 12,
|
||||||
|
'ang': 13,
|
||||||
|
'a u': 14,
|
||||||
|
'a k': 15,
|
||||||
|
'uku': 16,
|
||||||
|
'aba': 17,
|
||||||
|
' ku': 18,
|
||||||
|
'wa ': 19,
|
||||||
|
'enz': 20,
|
||||||
|
'lel': 21,
|
||||||
|
'ho ': 22,
|
||||||
|
'ni ': 23,
|
||||||
|
'ngo': 24,
|
||||||
|
'ath': 25,
|
||||||
|
'pha': 26,
|
||||||
|
'eth': 27,
|
||||||
|
'kha': 28,
|
||||||
|
'ana': 29,
|
||||||
|
'isa': 30,
|
||||||
|
'nge': 31,
|
||||||
|
' na': 32,
|
||||||
|
'o n': 33,
|
||||||
|
'tho': 34,
|
||||||
|
'e n': 35,
|
||||||
|
'the': 36,
|
||||||
|
'ha ': 37,
|
||||||
|
'esi': 38,
|
||||||
|
'nye': 39,
|
||||||
|
'kwe': 40,
|
||||||
|
'tjh': 41,
|
||||||
|
' kw': 42,
|
||||||
|
'ise': 43,
|
||||||
|
' um': 44,
|
||||||
|
'a a': 45,
|
||||||
|
' ne': 46,
|
||||||
|
'le ': 47,
|
||||||
|
'hla': 48,
|
||||||
|
'a e': 49,
|
||||||
|
'lan': 50,
|
||||||
|
'ben': 51,
|
||||||
|
'ndl': 52,
|
||||||
|
' no': 53,
|
||||||
|
'imi': 54,
|
||||||
|
'und': 55,
|
||||||
|
'ung': 56,
|
||||||
|
'thi': 57,
|
||||||
|
'nzi': 58,
|
||||||
|
'ye ': 59,
|
||||||
|
'isi': 60,
|
||||||
|
'uth': 61,
|
||||||
|
'o e': 62,
|
||||||
|
'ebe': 63,
|
||||||
|
'het': 64,
|
||||||
|
'kut': 65,
|
||||||
|
'and': 66,
|
||||||
|
'sa ': 67,
|
||||||
|
'elo': 68,
|
||||||
|
'fun': 69,
|
||||||
|
'eko': 70,
|
||||||
|
'seb': 71,
|
||||||
|
'ban': 72,
|
||||||
|
'ulu': 73,
|
||||||
|
'aka': 74,
|
||||||
|
'eli': 75,
|
||||||
|
'wen': 76,
|
||||||
|
'e i': 77,
|
||||||
|
' am': 78,
|
||||||
|
'eni': 79,
|
||||||
|
'ba ': 80,
|
||||||
|
'we ': 81,
|
||||||
|
'nel': 82,
|
||||||
|
' we': 83,
|
||||||
|
'kuf': 84,
|
||||||
|
'lwa': 85,
|
||||||
|
'i n': 86,
|
||||||
|
' is': 87,
|
||||||
|
'zi ': 88,
|
||||||
|
' lo': 89,
|
||||||
|
'kwa': 90,
|
||||||
|
'lok': 91,
|
||||||
|
'elw': 92,
|
||||||
|
'gok': 93,
|
||||||
|
'ona': 94,
|
||||||
|
'lek': 95,
|
||||||
|
'hi ': 96,
|
||||||
|
'li ': 97,
|
||||||
|
'gan': 98,
|
||||||
|
'bon': 99,
|
||||||
|
' ii': 100,
|
||||||
|
'ing': 101,
|
||||||
|
'ka ': 102,
|
||||||
|
'o i': 103,
|
||||||
|
'akh': 104,
|
||||||
|
'ane': 105,
|
||||||
|
'thu': 106,
|
||||||
|
'ula': 107,
|
||||||
|
'kel': 108,
|
||||||
|
'mth': 109,
|
||||||
|
' im': 110,
|
||||||
|
'ga ': 111,
|
||||||
|
' le': 112,
|
||||||
|
'nda': 113,
|
||||||
|
'fan': 114,
|
||||||
|
'nok': 115,
|
||||||
|
'i k': 116,
|
||||||
|
'end': 117,
|
||||||
|
'si ': 118,
|
||||||
|
'o w': 119,
|
||||||
|
'aph': 120,
|
||||||
|
'hat': 121,
|
||||||
|
'e u': 122,
|
||||||
|
'ala': 123,
|
||||||
|
'kub': 124,
|
||||||
|
'lun': 125,
|
||||||
|
'ikh': 126,
|
||||||
|
'o l': 127,
|
||||||
|
'ezi': 128,
|
||||||
|
'a l': 129,
|
||||||
|
'o u': 130,
|
||||||
|
'sis': 131,
|
||||||
|
'nam': 132,
|
||||||
|
'emi': 133,
|
||||||
|
' ab': 134,
|
||||||
|
'hul': 135,
|
||||||
|
'kus': 136,
|
||||||
|
' wo': 137,
|
||||||
|
'sek': 138,
|
||||||
|
'azi': 139,
|
||||||
|
'kho': 140,
|
||||||
|
'iin': 141,
|
||||||
|
'i u': 142,
|
||||||
|
'asi': 143,
|
||||||
|
'lol': 144,
|
||||||
|
'ini': 145,
|
||||||
|
'uph': 146,
|
||||||
|
'uhl': 147,
|
||||||
|
'khu': 148,
|
||||||
|
'no ': 149,
|
||||||
|
'o y': 150,
|
||||||
|
'ako': 151,
|
||||||
|
'a b': 152,
|
||||||
|
'i e': 153,
|
||||||
|
'o k': 154,
|
||||||
|
'i l': 155,
|
||||||
|
' be': 156,
|
||||||
|
'mal': 157,
|
||||||
|
' ye': 158,
|
||||||
|
'i i': 159,
|
||||||
|
'nde': 160,
|
||||||
|
'iph': 161,
|
||||||
|
'mel': 162,
|
||||||
|
'eke': 163,
|
||||||
|
'tha': 164,
|
||||||
|
'kun': 165,
|
||||||
|
'ngi': 166,
|
||||||
|
'e k': 167,
|
||||||
|
'eng': 168,
|
||||||
|
'o s': 169,
|
||||||
|
' yo': 170,
|
||||||
|
'so ': 171,
|
||||||
|
'ma ': 172,
|
||||||
|
'mkh': 173,
|
||||||
|
'jha': 174,
|
||||||
|
'isw': 175,
|
||||||
|
'lwe': 176,
|
||||||
|
' ez': 177,
|
||||||
|
'di ': 178,
|
||||||
|
'a w': 179,
|
||||||
|
'e a': 180,
|
||||||
|
'kul': 181,
|
||||||
|
'uny': 182,
|
||||||
|
'ume': 183,
|
||||||
|
'za ': 184,
|
||||||
|
'any': 185,
|
||||||
|
'ahl': 186,
|
||||||
|
'kuh': 187,
|
||||||
|
'een': 188,
|
||||||
|
' si': 189,
|
||||||
|
'ili': 190,
|
||||||
|
'itj': 191,
|
||||||
|
'zok': 192,
|
||||||
|
'ihl': 193,
|
||||||
|
' es': 194,
|
||||||
|
'ke ': 195,
|
||||||
|
'hlo': 196,
|
||||||
|
'hak': 197,
|
||||||
|
'phe': 198,
|
||||||
|
'lul': 199,
|
||||||
|
'dle': 200,
|
||||||
|
'luk': 201,
|
||||||
|
'da ': 202,
|
||||||
|
'eka': 203,
|
||||||
|
'amb': 204,
|
||||||
|
' se': 205,
|
||||||
|
'zis': 206,
|
||||||
|
'mbi': 207,
|
||||||
|
'hon': 208,
|
||||||
|
'dla': 209,
|
||||||
|
'aku': 210,
|
||||||
|
'jen': 211,
|
||||||
|
'zin': 212,
|
||||||
|
' ba': 213,
|
||||||
|
'ham': 214,
|
||||||
|
'i a': 215,
|
||||||
|
' bo': 216,
|
||||||
|
'o a': 217,
|
||||||
|
'ali': 218,
|
||||||
|
'use': 219,
|
||||||
|
'ile': 220,
|
||||||
|
'sik': 221,
|
||||||
|
'han': 222,
|
||||||
|
'wok': 223,
|
||||||
|
'okh': 224,
|
||||||
|
'hlu': 225,
|
||||||
|
'nya': 226,
|
||||||
|
'sit': 227,
|
||||||
|
'ani': 228,
|
||||||
|
'kuz': 229,
|
||||||
|
'o o': 230,
|
||||||
|
'ufa': 231,
|
||||||
|
'swa': 232,
|
||||||
|
'ind': 233,
|
||||||
|
'zak': 234,
|
||||||
|
'nis': 235,
|
||||||
|
'lis': 236,
|
||||||
|
'gab': 237,
|
||||||
|
'mi ': 238,
|
||||||
|
' em': 239,
|
||||||
|
' ko': 240,
|
||||||
|
'ano': 241,
|
||||||
|
' el': 242,
|
||||||
|
'hwa': 243,
|
||||||
|
'ufu': 244,
|
||||||
|
'a y': 245,
|
||||||
|
'wo ': 246,
|
||||||
|
' in': 247,
|
||||||
|
'lim': 248,
|
||||||
|
'tlo': 249,
|
||||||
|
'kat': 250,
|
||||||
|
'wak': 251,
|
||||||
|
'kan': 252,
|
||||||
|
'thw': 253,
|
||||||
|
'o z': 254,
|
||||||
|
'ith': 255,
|
||||||
|
'ndi': 256,
|
||||||
|
'yok': 257,
|
||||||
|
'yo ': 258,
|
||||||
|
'mit': 259,
|
||||||
|
'mis': 260,
|
||||||
|
'abo': 261,
|
||||||
|
'eku': 262,
|
||||||
|
'hab': 263,
|
||||||
|
'iny': 264,
|
||||||
|
'nan': 265,
|
||||||
|
'eze': 266,
|
||||||
|
'khe': 267,
|
||||||
|
'alo': 268,
|
||||||
|
'lu ': 269,
|
||||||
|
'man': 270,
|
||||||
|
'he ': 271,
|
||||||
|
'ezo': 272,
|
||||||
|
'kup': 273,
|
||||||
|
'ubu': 274,
|
||||||
|
' zo': 275,
|
||||||
|
'gam': 276,
|
||||||
|
'hel': 277,
|
||||||
|
'wan': 278,
|
||||||
|
'omb': 279,
|
||||||
|
'amk': 280,
|
||||||
|
'nza': 281,
|
||||||
|
'ola': 282,
|
||||||
|
'hum': 283,
|
||||||
|
'kuk': 284,
|
||||||
|
'du ': 285,
|
||||||
|
' la': 286,
|
||||||
|
'kom': 287,
|
||||||
|
'i y': 288,
|
||||||
|
'obu': 289,
|
||||||
|
'i b': 290,
|
||||||
|
'odu': 291,
|
||||||
|
'okw': 292,
|
||||||
|
'gap': 293,
|
||||||
|
' ka': 294,
|
||||||
|
'be ': 295,
|
||||||
|
' il': 296,
|
||||||
|
'alu': 297,
|
||||||
|
'atj': 298,
|
||||||
|
'e b': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/nso.py
Normal file
303
libs/guess_language/data/models/nso.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'go ': 0,
|
||||||
|
' go': 1,
|
||||||
|
' le': 2,
|
||||||
|
' a ': 3,
|
||||||
|
'le ': 4,
|
||||||
|
' di': 5,
|
||||||
|
'a g': 6,
|
||||||
|
'ya ': 7,
|
||||||
|
'lo ': 8,
|
||||||
|
' ya': 9,
|
||||||
|
'a m': 10,
|
||||||
|
'ka ': 11,
|
||||||
|
' ka': 12,
|
||||||
|
'la ': 13,
|
||||||
|
' t ': 14,
|
||||||
|
'o y': 15,
|
||||||
|
'a t': 16,
|
||||||
|
'a k': 17,
|
||||||
|
'ba ': 18,
|
||||||
|
'et ': 19,
|
||||||
|
'wa ': 20,
|
||||||
|
' mo': 21,
|
||||||
|
' e ': 22,
|
||||||
|
'a b': 23,
|
||||||
|
' se': 24,
|
||||||
|
' ba': 25,
|
||||||
|
' ma': 26,
|
||||||
|
' bo': 27,
|
||||||
|
'e g': 28,
|
||||||
|
't a': 29,
|
||||||
|
' o ': 30,
|
||||||
|
'a l': 31,
|
||||||
|
'o t': 32,
|
||||||
|
'na ': 33,
|
||||||
|
'o l': 34,
|
||||||
|
'a d': 35,
|
||||||
|
'elo': 36,
|
||||||
|
'di ': 37,
|
||||||
|
'a s': 38,
|
||||||
|
'o g': 39,
|
||||||
|
'o k': 40,
|
||||||
|
'ele': 41,
|
||||||
|
'o a': 42,
|
||||||
|
'ng ': 43,
|
||||||
|
't e': 44,
|
||||||
|
'o b': 45,
|
||||||
|
'mo ': 46,
|
||||||
|
'e t': 47,
|
||||||
|
'e m': 48,
|
||||||
|
'ego': 49,
|
||||||
|
'eo ': 50,
|
||||||
|
'e l': 51,
|
||||||
|
'ngw': 52,
|
||||||
|
'se ': 53,
|
||||||
|
'e b': 54,
|
||||||
|
'kgo': 55,
|
||||||
|
'ela': 56,
|
||||||
|
' wa': 57,
|
||||||
|
' ga': 58,
|
||||||
|
'e k': 59,
|
||||||
|
'ago': 60,
|
||||||
|
'o m': 61,
|
||||||
|
' kg': 62,
|
||||||
|
'ga ': 63,
|
||||||
|
'dit': 64,
|
||||||
|
'olo': 65,
|
||||||
|
't h': 66,
|
||||||
|
'e d': 67,
|
||||||
|
'o d': 68,
|
||||||
|
' ye': 69,
|
||||||
|
'ane': 70,
|
||||||
|
'lel': 71,
|
||||||
|
'we ': 72,
|
||||||
|
' tl': 73,
|
||||||
|
'thu': 74,
|
||||||
|
'ona': 75,
|
||||||
|
' th': 76,
|
||||||
|
't w': 77,
|
||||||
|
'hut': 78,
|
||||||
|
'ana': 79,
|
||||||
|
'tla': 80,
|
||||||
|
'wan': 81,
|
||||||
|
'aba': 82,
|
||||||
|
'ola': 83,
|
||||||
|
' me': 84,
|
||||||
|
'gwa': 85,
|
||||||
|
're ': 86,
|
||||||
|
'ong': 87,
|
||||||
|
't o': 88,
|
||||||
|
'lao': 89,
|
||||||
|
'e s': 90,
|
||||||
|
'o s': 91,
|
||||||
|
'a y': 92,
|
||||||
|
'alo': 93,
|
||||||
|
'set': 94,
|
||||||
|
'a p': 95,
|
||||||
|
'i a': 96,
|
||||||
|
'eng': 97,
|
||||||
|
'a a': 98,
|
||||||
|
'o e': 99,
|
||||||
|
'tho': 100,
|
||||||
|
' ke': 101,
|
||||||
|
'gwe': 102,
|
||||||
|
' ha': 103,
|
||||||
|
'hlo': 104,
|
||||||
|
'edi': 105,
|
||||||
|
' la': 106,
|
||||||
|
'ao ': 107,
|
||||||
|
' ts': 108,
|
||||||
|
'aka': 109,
|
||||||
|
'hla': 110,
|
||||||
|
'ala': 111,
|
||||||
|
'swa': 112,
|
||||||
|
' we': 113,
|
||||||
|
' bj': 114,
|
||||||
|
'o o': 115,
|
||||||
|
'gor': 116,
|
||||||
|
'aga': 117,
|
||||||
|
'hab': 118,
|
||||||
|
'gob': 119,
|
||||||
|
'let': 120,
|
||||||
|
'ke ': 121,
|
||||||
|
'dik': 122,
|
||||||
|
'sa ': 123,
|
||||||
|
' i ': 124,
|
||||||
|
'oba': 125,
|
||||||
|
' hl': 126,
|
||||||
|
'the': 127,
|
||||||
|
'dir': 128,
|
||||||
|
'a n': 129,
|
||||||
|
'ith': 130,
|
||||||
|
'bja': 131,
|
||||||
|
'ye ': 132,
|
||||||
|
'no ': 133,
|
||||||
|
' sa': 134,
|
||||||
|
'mol': 135,
|
||||||
|
'lwa': 136,
|
||||||
|
'ti ': 137,
|
||||||
|
'man': 138,
|
||||||
|
'ole': 139,
|
||||||
|
'e e': 140,
|
||||||
|
'tse': 141,
|
||||||
|
'o w': 142,
|
||||||
|
'ore': 143,
|
||||||
|
'to ': 144,
|
||||||
|
'at ': 145,
|
||||||
|
'eth': 146,
|
||||||
|
'e y': 147,
|
||||||
|
'kan': 148,
|
||||||
|
'tsh': 149,
|
||||||
|
'gon': 150,
|
||||||
|
'net': 151,
|
||||||
|
'ano': 152,
|
||||||
|
'kar': 153,
|
||||||
|
'ge ': 154,
|
||||||
|
'ho ': 155,
|
||||||
|
'lok': 156,
|
||||||
|
' sw': 157,
|
||||||
|
' na': 158,
|
||||||
|
'i b': 159,
|
||||||
|
'dip': 160,
|
||||||
|
'i o': 161,
|
||||||
|
'oka': 162,
|
||||||
|
' ge': 163,
|
||||||
|
' om': 164,
|
||||||
|
'ko ': 165,
|
||||||
|
'emo': 166,
|
||||||
|
'pel': 167,
|
||||||
|
'nt ': 168,
|
||||||
|
'e a': 169,
|
||||||
|
'mel': 170,
|
||||||
|
'leg': 171,
|
||||||
|
'tlh': 172,
|
||||||
|
'me ': 173,
|
||||||
|
'ete': 174,
|
||||||
|
'phe': 175,
|
||||||
|
'a e': 176,
|
||||||
|
'o n': 177,
|
||||||
|
'o i': 178,
|
||||||
|
'wal': 179,
|
||||||
|
'oko': 180,
|
||||||
|
'nya': 181,
|
||||||
|
'bol': 182,
|
||||||
|
'odi': 183,
|
||||||
|
'weg': 184,
|
||||||
|
'te ': 185,
|
||||||
|
'e n': 186,
|
||||||
|
'ta ': 187,
|
||||||
|
'any': 188,
|
||||||
|
'yeo': 189,
|
||||||
|
'kga': 190,
|
||||||
|
'pol': 191,
|
||||||
|
'ang': 192,
|
||||||
|
'ri ': 193,
|
||||||
|
'it ': 194,
|
||||||
|
'uto': 195,
|
||||||
|
' mm': 196,
|
||||||
|
'iti': 197,
|
||||||
|
'are': 198,
|
||||||
|
'o f': 199,
|
||||||
|
'ha ': 200,
|
||||||
|
'gat': 201,
|
||||||
|
'oth': 202,
|
||||||
|
'ika': 203,
|
||||||
|
'o h': 204,
|
||||||
|
' it': 205,
|
||||||
|
'she': 206,
|
||||||
|
'ath': 207,
|
||||||
|
'ale': 208,
|
||||||
|
'iri': 209,
|
||||||
|
'pha': 210,
|
||||||
|
'ahl': 211,
|
||||||
|
' te': 212,
|
||||||
|
'ohl': 213,
|
||||||
|
'tha': 214,
|
||||||
|
' re': 215,
|
||||||
|
'bon': 216,
|
||||||
|
'lha': 217,
|
||||||
|
' ph': 218,
|
||||||
|
'din': 219,
|
||||||
|
' pe': 220,
|
||||||
|
'ro ': 221,
|
||||||
|
'mi ': 222,
|
||||||
|
'omi': 223,
|
||||||
|
'i t': 224,
|
||||||
|
' fa': 225,
|
||||||
|
'aro': 226,
|
||||||
|
'ase': 227,
|
||||||
|
'i l': 228,
|
||||||
|
'ne ': 229,
|
||||||
|
'lal': 230,
|
||||||
|
'ogo': 231,
|
||||||
|
'kol': 232,
|
||||||
|
' wo': 233,
|
||||||
|
't i': 234,
|
||||||
|
'omo': 235,
|
||||||
|
' be': 236,
|
||||||
|
'mog': 237,
|
||||||
|
'mok': 238,
|
||||||
|
'len': 239,
|
||||||
|
'ile': 240,
|
||||||
|
'lwe': 241,
|
||||||
|
'ma ': 242,
|
||||||
|
'uta': 243,
|
||||||
|
'nse': 244,
|
||||||
|
'amo': 245,
|
||||||
|
'a o': 246,
|
||||||
|
' fe': 247,
|
||||||
|
'okg': 248,
|
||||||
|
'ja ': 249,
|
||||||
|
'pan': 250,
|
||||||
|
'nag': 251,
|
||||||
|
'ekg': 252,
|
||||||
|
'i i': 253,
|
||||||
|
'apa': 254,
|
||||||
|
'get': 255,
|
||||||
|
'lon': 256,
|
||||||
|
'ra ': 257,
|
||||||
|
'aem': 258,
|
||||||
|
' yo': 259,
|
||||||
|
'atl': 260,
|
||||||
|
'tlo': 261,
|
||||||
|
'kel': 262,
|
||||||
|
'tel': 263,
|
||||||
|
' kh': 264,
|
||||||
|
' po': 265,
|
||||||
|
'e o': 266,
|
||||||
|
'a w': 267,
|
||||||
|
'ent': 268,
|
||||||
|
'i e': 269,
|
||||||
|
'bo ': 270,
|
||||||
|
'gan': 271,
|
||||||
|
'het': 272,
|
||||||
|
'mal': 273,
|
||||||
|
'a f': 274,
|
||||||
|
'otl': 275,
|
||||||
|
'uti': 276,
|
||||||
|
'oga': 277,
|
||||||
|
'sen': 278,
|
||||||
|
'kwa': 279,
|
||||||
|
'mae': 280,
|
||||||
|
'eka': 281,
|
||||||
|
'mme': 282,
|
||||||
|
'kge': 283,
|
||||||
|
'jal': 284,
|
||||||
|
'a r': 285,
|
||||||
|
'ing': 286,
|
||||||
|
'lek': 287,
|
||||||
|
'sep': 288,
|
||||||
|
'lag': 289,
|
||||||
|
'ofe': 290,
|
||||||
|
'wag': 291,
|
||||||
|
'g y': 292,
|
||||||
|
'rol': 293,
|
||||||
|
'epe': 294,
|
||||||
|
'eko': 295,
|
||||||
|
'bok': 296,
|
||||||
|
'o p': 297,
|
||||||
|
'adi': 298,
|
||||||
|
'log': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/pl.py
Normal file
303
libs/guess_language/data/models/pl.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'ie ': 0,
|
||||||
|
'nie': 1,
|
||||||
|
'em ': 2,
|
||||||
|
' ni': 3,
|
||||||
|
' po': 4,
|
||||||
|
' pr': 5,
|
||||||
|
'dzi': 6,
|
||||||
|
' na': 7,
|
||||||
|
'że ': 8,
|
||||||
|
'rze': 9,
|
||||||
|
'na ': 10,
|
||||||
|
'łem': 11,
|
||||||
|
'wie': 12,
|
||||||
|
' w ': 13,
|
||||||
|
' że': 14,
|
||||||
|
'go ': 15,
|
||||||
|
' by': 16,
|
||||||
|
'prz': 17,
|
||||||
|
'owa': 18,
|
||||||
|
'ię ': 19,
|
||||||
|
' do': 20,
|
||||||
|
' si': 21,
|
||||||
|
'owi': 22,
|
||||||
|
' pa': 23,
|
||||||
|
' za': 24,
|
||||||
|
'ch ': 25,
|
||||||
|
'ego': 26,
|
||||||
|
'ał ': 27,
|
||||||
|
'się': 28,
|
||||||
|
'ej ': 29,
|
||||||
|
'wał': 30,
|
||||||
|
'ym ': 31,
|
||||||
|
'ani': 32,
|
||||||
|
'ałe': 33,
|
||||||
|
'to ': 34,
|
||||||
|
' i ': 35,
|
||||||
|
' to': 36,
|
||||||
|
' te': 37,
|
||||||
|
'e p': 38,
|
||||||
|
' je': 39,
|
||||||
|
' z ': 40,
|
||||||
|
'czy': 41,
|
||||||
|
'był': 42,
|
||||||
|
'pan': 43,
|
||||||
|
'sta': 44,
|
||||||
|
'kie': 45,
|
||||||
|
' ja': 46,
|
||||||
|
'do ': 47,
|
||||||
|
' ch': 48,
|
||||||
|
' cz': 49,
|
||||||
|
' wi': 50,
|
||||||
|
'iał': 51,
|
||||||
|
'a p': 52,
|
||||||
|
'pow': 53,
|
||||||
|
' mi': 54,
|
||||||
|
'li ': 55,
|
||||||
|
'eni': 56,
|
||||||
|
'zie': 57,
|
||||||
|
' ta': 58,
|
||||||
|
' wa': 59,
|
||||||
|
'ło ': 60,
|
||||||
|
'ać ': 61,
|
||||||
|
'dy ': 62,
|
||||||
|
'ak ': 63,
|
||||||
|
'e w': 64,
|
||||||
|
' a ': 65,
|
||||||
|
' od': 66,
|
||||||
|
' st': 67,
|
||||||
|
'nia': 68,
|
||||||
|
'rzy': 69,
|
||||||
|
'ied': 70,
|
||||||
|
' kt': 71,
|
||||||
|
'odz': 72,
|
||||||
|
'cie': 73,
|
||||||
|
'cze': 74,
|
||||||
|
'ia ': 75,
|
||||||
|
'iel': 76,
|
||||||
|
'któ': 77,
|
||||||
|
'o p': 78,
|
||||||
|
'tór': 79,
|
||||||
|
'ści': 80,
|
||||||
|
' sp': 81,
|
||||||
|
' wy': 82,
|
||||||
|
'jak': 83,
|
||||||
|
'tak': 84,
|
||||||
|
'zy ': 85,
|
||||||
|
' mo': 86,
|
||||||
|
'ałę': 87,
|
||||||
|
'pro': 88,
|
||||||
|
'ski': 89,
|
||||||
|
'tem': 90,
|
||||||
|
'łęs': 91,
|
||||||
|
' tr': 92,
|
||||||
|
'e m': 93,
|
||||||
|
'jes': 94,
|
||||||
|
'my ': 95,
|
||||||
|
' ro': 96,
|
||||||
|
'edz': 97,
|
||||||
|
'eli': 98,
|
||||||
|
'iej': 99,
|
||||||
|
' rz': 100,
|
||||||
|
'a n': 101,
|
||||||
|
'ale': 102,
|
||||||
|
'an ': 103,
|
||||||
|
'e s': 104,
|
||||||
|
'est': 105,
|
||||||
|
'le ': 106,
|
||||||
|
'o s': 107,
|
||||||
|
'i p': 108,
|
||||||
|
'ki ': 109,
|
||||||
|
' co': 110,
|
||||||
|
'ada': 111,
|
||||||
|
'czn': 112,
|
||||||
|
'e t': 113,
|
||||||
|
'e z': 114,
|
||||||
|
'ent': 115,
|
||||||
|
'ny ': 116,
|
||||||
|
'pre': 117,
|
||||||
|
'rzą': 118,
|
||||||
|
'y s': 119,
|
||||||
|
' ko': 120,
|
||||||
|
' o ': 121,
|
||||||
|
'ach': 122,
|
||||||
|
'am ': 123,
|
||||||
|
'e n': 124,
|
||||||
|
'o t': 125,
|
||||||
|
'oli': 126,
|
||||||
|
'pod': 127,
|
||||||
|
'zia': 128,
|
||||||
|
' go': 129,
|
||||||
|
' ka': 130,
|
||||||
|
'by ': 131,
|
||||||
|
'ieg': 132,
|
||||||
|
'ier': 133,
|
||||||
|
'noś': 134,
|
||||||
|
'roz': 135,
|
||||||
|
'spo': 136,
|
||||||
|
'ych': 137,
|
||||||
|
'ząd': 138,
|
||||||
|
' mn': 139,
|
||||||
|
'acz': 140,
|
||||||
|
'adz': 141,
|
||||||
|
'bie': 142,
|
||||||
|
'cho': 143,
|
||||||
|
'mni': 144,
|
||||||
|
'o n': 145,
|
||||||
|
'ost': 146,
|
||||||
|
'pra': 147,
|
||||||
|
'ze ': 148,
|
||||||
|
'ła ': 149,
|
||||||
|
' so': 150,
|
||||||
|
'a m': 151,
|
||||||
|
'cza': 152,
|
||||||
|
'iem': 153,
|
||||||
|
'ić ': 154,
|
||||||
|
'obi': 155,
|
||||||
|
'ył ': 156,
|
||||||
|
'yło': 157,
|
||||||
|
' mu': 158,
|
||||||
|
' mó': 159,
|
||||||
|
'a t': 160,
|
||||||
|
'acj': 161,
|
||||||
|
'ci ': 162,
|
||||||
|
'e b': 163,
|
||||||
|
'ich': 164,
|
||||||
|
'kan': 165,
|
||||||
|
'mi ': 166,
|
||||||
|
'mie': 167,
|
||||||
|
'ośc': 168,
|
||||||
|
'row': 169,
|
||||||
|
'zen': 170,
|
||||||
|
'zyd': 171,
|
||||||
|
' al': 172,
|
||||||
|
' re': 173,
|
||||||
|
'a w': 174,
|
||||||
|
'den': 175,
|
||||||
|
'edy': 176,
|
||||||
|
'ił ': 177,
|
||||||
|
'ko ': 178,
|
||||||
|
'o w': 179,
|
||||||
|
'rac': 180,
|
||||||
|
'śmy': 181,
|
||||||
|
' ma': 182,
|
||||||
|
' ra': 183,
|
||||||
|
' sz': 184,
|
||||||
|
' ty': 185,
|
||||||
|
'e j': 186,
|
||||||
|
'isk': 187,
|
||||||
|
'ji ': 188,
|
||||||
|
'ka ': 189,
|
||||||
|
'm s': 190,
|
||||||
|
'no ': 191,
|
||||||
|
'o z': 192,
|
||||||
|
'rez': 193,
|
||||||
|
'wa ': 194,
|
||||||
|
'ów ': 195,
|
||||||
|
'łow': 196,
|
||||||
|
'ść ': 197,
|
||||||
|
' ob': 198,
|
||||||
|
'ech': 199,
|
||||||
|
'ecz': 200,
|
||||||
|
'ezy': 201,
|
||||||
|
'i w': 202,
|
||||||
|
'ja ': 203,
|
||||||
|
'kon': 204,
|
||||||
|
'mów': 205,
|
||||||
|
'ne ': 206,
|
||||||
|
'ni ': 207,
|
||||||
|
'now': 208,
|
||||||
|
'nym': 209,
|
||||||
|
'pol': 210,
|
||||||
|
'pot': 211,
|
||||||
|
'yde': 212,
|
||||||
|
' dl': 213,
|
||||||
|
' sy': 214,
|
||||||
|
'a s': 215,
|
||||||
|
'aki': 216,
|
||||||
|
'ali': 217,
|
||||||
|
'dla': 218,
|
||||||
|
'icz': 219,
|
||||||
|
'ku ': 220,
|
||||||
|
'ocz': 221,
|
||||||
|
'st ': 222,
|
||||||
|
'str': 223,
|
||||||
|
'szy': 224,
|
||||||
|
'trz': 225,
|
||||||
|
'wia': 226,
|
||||||
|
'y p': 227,
|
||||||
|
'za ': 228,
|
||||||
|
' wt': 229,
|
||||||
|
'chc': 230,
|
||||||
|
'esz': 231,
|
||||||
|
'iec': 232,
|
||||||
|
'im ': 233,
|
||||||
|
'la ': 234,
|
||||||
|
'o m': 235,
|
||||||
|
'sa ': 236,
|
||||||
|
'wać': 237,
|
||||||
|
'y n': 238,
|
||||||
|
'zac': 239,
|
||||||
|
'zec': 240,
|
||||||
|
' gd': 241,
|
||||||
|
'a z': 242,
|
||||||
|
'ard': 243,
|
||||||
|
'co ': 244,
|
||||||
|
'dar': 245,
|
||||||
|
'e r': 246,
|
||||||
|
'ien': 247,
|
||||||
|
'm n': 248,
|
||||||
|
'm w': 249,
|
||||||
|
'mia': 250,
|
||||||
|
'moż': 251,
|
||||||
|
'raw': 252,
|
||||||
|
'rdz': 253,
|
||||||
|
'tan': 254,
|
||||||
|
'ted': 255,
|
||||||
|
'teg': 256,
|
||||||
|
'wił': 257,
|
||||||
|
'wte': 258,
|
||||||
|
'y z': 259,
|
||||||
|
'zna': 260,
|
||||||
|
'zło': 261,
|
||||||
|
'a r': 262,
|
||||||
|
'awi': 263,
|
||||||
|
'bar': 264,
|
||||||
|
'cji': 265,
|
||||||
|
'czą': 266,
|
||||||
|
'dow': 267,
|
||||||
|
'eż ': 268,
|
||||||
|
'gdy': 269,
|
||||||
|
'iek': 270,
|
||||||
|
'je ': 271,
|
||||||
|
'o d': 272,
|
||||||
|
'tał': 273,
|
||||||
|
'wal': 274,
|
||||||
|
'wsz': 275,
|
||||||
|
'zed': 276,
|
||||||
|
'ówi': 277,
|
||||||
|
'ęsa': 278,
|
||||||
|
' ba': 279,
|
||||||
|
' lu': 280,
|
||||||
|
' wo': 281,
|
||||||
|
'aln': 282,
|
||||||
|
'arn': 283,
|
||||||
|
'ba ': 284,
|
||||||
|
'dzo': 285,
|
||||||
|
'e c': 286,
|
||||||
|
'hod': 287,
|
||||||
|
'igi': 288,
|
||||||
|
'lig': 289,
|
||||||
|
'm p': 290,
|
||||||
|
'myś': 291,
|
||||||
|
'o c': 292,
|
||||||
|
'oni': 293,
|
||||||
|
'rel': 294,
|
||||||
|
'sku': 295,
|
||||||
|
'ste': 296,
|
||||||
|
'y w': 297,
|
||||||
|
'yst': 298,
|
||||||
|
'z w': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/ps.py
Normal file
303
libs/guess_language/data/models/ps.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
' د ': 0,
|
||||||
|
'اؤ ': 1,
|
||||||
|
' اؤ': 2,
|
||||||
|
'نو ': 3,
|
||||||
|
'ې د': 4,
|
||||||
|
'ره ': 5,
|
||||||
|
' په': 6,
|
||||||
|
'نه ': 7,
|
||||||
|
'چې ': 8,
|
||||||
|
' چې': 9,
|
||||||
|
'په ': 10,
|
||||||
|
'ه د': 11,
|
||||||
|
'ته ': 12,
|
||||||
|
'و ا': 13,
|
||||||
|
'ونو': 14,
|
||||||
|
'و د': 15,
|
||||||
|
' او': 16,
|
||||||
|
'انو': 17,
|
||||||
|
'ونه': 18,
|
||||||
|
'ه ک': 19,
|
||||||
|
' دا': 20,
|
||||||
|
'ه ا': 21,
|
||||||
|
'دې ': 22,
|
||||||
|
'ښې ': 23,
|
||||||
|
' کې': 24,
|
||||||
|
'ان ': 25,
|
||||||
|
'لو ': 26,
|
||||||
|
'هم ': 27,
|
||||||
|
'و م': 28,
|
||||||
|
'کښې': 29,
|
||||||
|
'ه م': 30,
|
||||||
|
'ى ا': 31,
|
||||||
|
' نو': 32,
|
||||||
|
' ته': 33,
|
||||||
|
' کښ': 34,
|
||||||
|
'رون': 35,
|
||||||
|
'کې ': 36,
|
||||||
|
'ده ': 37,
|
||||||
|
'له ': 38,
|
||||||
|
'به ': 39,
|
||||||
|
'رو ': 40,
|
||||||
|
' هم': 41,
|
||||||
|
'ه و': 42,
|
||||||
|
'وى ': 43,
|
||||||
|
'او ': 44,
|
||||||
|
'تون': 45,
|
||||||
|
'دا ': 46,
|
||||||
|
' کو': 47,
|
||||||
|
' کړ': 48,
|
||||||
|
'قام': 49,
|
||||||
|
' تر': 50,
|
||||||
|
'ران': 51,
|
||||||
|
'ه پ': 52,
|
||||||
|
'ې و': 53,
|
||||||
|
'ې پ': 54,
|
||||||
|
' به': 55,
|
||||||
|
' خو': 56,
|
||||||
|
'تو ': 57,
|
||||||
|
'د د': 58,
|
||||||
|
'د ا': 59,
|
||||||
|
'ه ت': 60,
|
||||||
|
'و پ': 61,
|
||||||
|
'يا ': 62,
|
||||||
|
' خپ': 63,
|
||||||
|
' دو': 64,
|
||||||
|
' را': 65,
|
||||||
|
' مش': 66,
|
||||||
|
' پر': 67,
|
||||||
|
'ارو': 68,
|
||||||
|
'رې ': 69,
|
||||||
|
'م د': 70,
|
||||||
|
'مشر': 71,
|
||||||
|
' شو': 72,
|
||||||
|
' ور': 73,
|
||||||
|
'ار ': 74,
|
||||||
|
'دى ': 75,
|
||||||
|
' اد': 76,
|
||||||
|
' دى': 77,
|
||||||
|
' مو': 78,
|
||||||
|
'د پ': 79,
|
||||||
|
'لي ': 80,
|
||||||
|
'و ک': 81,
|
||||||
|
' مق': 82,
|
||||||
|
' يو': 83,
|
||||||
|
'ؤ د': 84,
|
||||||
|
'خپل': 85,
|
||||||
|
'سره': 86,
|
||||||
|
'ه چ': 87,
|
||||||
|
'ور ': 88,
|
||||||
|
' تا': 89,
|
||||||
|
' دې': 90,
|
||||||
|
' رو': 91,
|
||||||
|
' سر': 92,
|
||||||
|
' مل': 93,
|
||||||
|
' کا': 94,
|
||||||
|
'ؤ ا': 95,
|
||||||
|
'اره': 96,
|
||||||
|
'برو': 97,
|
||||||
|
'مه ': 98,
|
||||||
|
'ه ب': 99,
|
||||||
|
'و ت': 100,
|
||||||
|
'پښت': 101,
|
||||||
|
' با': 102,
|
||||||
|
' دغ': 103,
|
||||||
|
' قب': 104,
|
||||||
|
' له': 105,
|
||||||
|
' وا': 106,
|
||||||
|
' پا': 107,
|
||||||
|
' پښ': 108,
|
||||||
|
'د م': 109,
|
||||||
|
'د ه': 110,
|
||||||
|
'لې ': 111,
|
||||||
|
'مات': 112,
|
||||||
|
'مو ': 113,
|
||||||
|
'ه ه': 114,
|
||||||
|
'وي ': 115,
|
||||||
|
'ې ب': 116,
|
||||||
|
'ې ک': 117,
|
||||||
|
' ده': 118,
|
||||||
|
' قا': 119,
|
||||||
|
'ال ': 120,
|
||||||
|
'اما': 121,
|
||||||
|
'د ن': 122,
|
||||||
|
'قبر': 123,
|
||||||
|
'ه ن': 124,
|
||||||
|
'پار': 125,
|
||||||
|
' اث': 126,
|
||||||
|
' بي': 127,
|
||||||
|
' لا': 128,
|
||||||
|
' لر': 129,
|
||||||
|
'اثا': 130,
|
||||||
|
'د خ': 131,
|
||||||
|
'دار': 132,
|
||||||
|
'ريخ': 133,
|
||||||
|
'شرا': 134,
|
||||||
|
'مقا': 135,
|
||||||
|
'نۍ ': 136,
|
||||||
|
'ه ر': 137,
|
||||||
|
'ه ل': 138,
|
||||||
|
'ولو': 139,
|
||||||
|
'يو ': 140,
|
||||||
|
'کوم': 141,
|
||||||
|
' دد': 142,
|
||||||
|
' لو': 143,
|
||||||
|
' مح': 144,
|
||||||
|
' مر': 145,
|
||||||
|
' وو': 146,
|
||||||
|
'اتو': 147,
|
||||||
|
'اري': 148,
|
||||||
|
'الو': 149,
|
||||||
|
'اند': 150,
|
||||||
|
'خان': 151,
|
||||||
|
'د ت': 152,
|
||||||
|
'سې ': 153,
|
||||||
|
'لى ': 154,
|
||||||
|
'نور': 155,
|
||||||
|
'و ل': 156,
|
||||||
|
'ي چ': 157,
|
||||||
|
'ړي ': 158,
|
||||||
|
'ښتو': 159,
|
||||||
|
'ې ل': 160,
|
||||||
|
' جو': 161,
|
||||||
|
' سي': 162,
|
||||||
|
'ام ': 163,
|
||||||
|
'بان': 164,
|
||||||
|
'تار': 165,
|
||||||
|
'تر ': 166,
|
||||||
|
'ثار': 167,
|
||||||
|
'خو ': 168,
|
||||||
|
'دو ': 169,
|
||||||
|
'ر ک': 170,
|
||||||
|
'ل د': 171,
|
||||||
|
'مون': 172,
|
||||||
|
'ندې': 173,
|
||||||
|
'و ن': 174,
|
||||||
|
'ول ': 175,
|
||||||
|
'وه ': 176,
|
||||||
|
'ى و': 177,
|
||||||
|
'ي د': 178,
|
||||||
|
'ې ا': 179,
|
||||||
|
'ې ت': 180,
|
||||||
|
'ې ي': 181,
|
||||||
|
' حک': 182,
|
||||||
|
' خب': 183,
|
||||||
|
' نه': 184,
|
||||||
|
' پو': 185,
|
||||||
|
'ا د': 186,
|
||||||
|
'تې ': 187,
|
||||||
|
'جوړ': 188,
|
||||||
|
'حکم': 189,
|
||||||
|
'حکو': 190,
|
||||||
|
'خبر': 191,
|
||||||
|
'دان': 192,
|
||||||
|
'ر د': 193,
|
||||||
|
'غه ': 194,
|
||||||
|
'قاف': 195,
|
||||||
|
'محک': 196,
|
||||||
|
'وال': 197,
|
||||||
|
'ومت': 198,
|
||||||
|
'ويل': 199,
|
||||||
|
'ى د': 200,
|
||||||
|
'ى م': 201,
|
||||||
|
'يره': 202,
|
||||||
|
'پر ': 203,
|
||||||
|
'کول': 204,
|
||||||
|
'ې ه': 205,
|
||||||
|
' تي': 206,
|
||||||
|
' خا': 207,
|
||||||
|
' وک': 208,
|
||||||
|
' يا': 209,
|
||||||
|
' ځا': 210,
|
||||||
|
'ؤ ق': 211,
|
||||||
|
'انۍ': 212,
|
||||||
|
'بى ': 213,
|
||||||
|
'غو ': 214,
|
||||||
|
'ه خ': 215,
|
||||||
|
'و ب': 216,
|
||||||
|
'ودا': 217,
|
||||||
|
'يدو': 218,
|
||||||
|
'ړې ': 219,
|
||||||
|
'کال': 220,
|
||||||
|
' بر': 221,
|
||||||
|
' قد': 222,
|
||||||
|
' مي': 223,
|
||||||
|
' وي': 224,
|
||||||
|
' کر': 225,
|
||||||
|
'ؤ م': 226,
|
||||||
|
'ات ': 227,
|
||||||
|
'ايي': 228,
|
||||||
|
'تى ': 229,
|
||||||
|
'تيا': 230,
|
||||||
|
'تير': 231,
|
||||||
|
'خوا': 232,
|
||||||
|
'دغو': 233,
|
||||||
|
'دم ': 234,
|
||||||
|
'ديم': 235,
|
||||||
|
'ر و': 236,
|
||||||
|
'قدي': 237,
|
||||||
|
'م خ': 238,
|
||||||
|
'مان': 239,
|
||||||
|
'مې ': 240,
|
||||||
|
'نيو': 241,
|
||||||
|
'نږ ': 242,
|
||||||
|
'ه ي': 243,
|
||||||
|
'و س': 244,
|
||||||
|
'و چ': 245,
|
||||||
|
'وان': 246,
|
||||||
|
'ورو': 247,
|
||||||
|
'ونږ': 248,
|
||||||
|
'پور': 249,
|
||||||
|
'ړه ': 250,
|
||||||
|
'ړو ': 251,
|
||||||
|
'ۍ د': 252,
|
||||||
|
'ې ن': 253,
|
||||||
|
' اه': 254,
|
||||||
|
' زي': 255,
|
||||||
|
' سو': 256,
|
||||||
|
' شي': 257,
|
||||||
|
' هر': 258,
|
||||||
|
' هغ': 259,
|
||||||
|
' ښا': 260,
|
||||||
|
'اتل': 261,
|
||||||
|
'اق ': 262,
|
||||||
|
'اني': 263,
|
||||||
|
'بري': 264,
|
||||||
|
'بې ': 265,
|
||||||
|
'ت ا': 266,
|
||||||
|
'د ب': 267,
|
||||||
|
'د س': 268,
|
||||||
|
'ر م': 269,
|
||||||
|
'رى ': 270,
|
||||||
|
'عرا': 271,
|
||||||
|
'لان': 272,
|
||||||
|
'مى ': 273,
|
||||||
|
'نى ': 274,
|
||||||
|
'و خ': 275,
|
||||||
|
'وئ ': 276,
|
||||||
|
'ورک': 277,
|
||||||
|
'ورې': 278,
|
||||||
|
'ون ': 279,
|
||||||
|
'وکړ': 280,
|
||||||
|
'ى چ': 281,
|
||||||
|
'يمه': 282,
|
||||||
|
'يې ': 283,
|
||||||
|
'ښتن': 284,
|
||||||
|
'که ': 285,
|
||||||
|
'کړي': 286,
|
||||||
|
'ې خ': 287,
|
||||||
|
'ے ش': 288,
|
||||||
|
' تح': 289,
|
||||||
|
' تو': 290,
|
||||||
|
' در': 291,
|
||||||
|
' دپ': 292,
|
||||||
|
' صو': 293,
|
||||||
|
' عر': 294,
|
||||||
|
' ول': 295,
|
||||||
|
' يؤ': 296,
|
||||||
|
' پۀ': 297,
|
||||||
|
' څو': 298,
|
||||||
|
'ا ا': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/pt.py
Normal file
303
libs/guess_language/data/models/pt.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'de ': 0,
|
||||||
|
' de': 1,
|
||||||
|
'os ': 2,
|
||||||
|
'as ': 3,
|
||||||
|
'que': 4,
|
||||||
|
' co': 5,
|
||||||
|
'ão ': 6,
|
||||||
|
'o d': 7,
|
||||||
|
' qu': 8,
|
||||||
|
'ue ': 9,
|
||||||
|
' a ': 10,
|
||||||
|
'do ': 11,
|
||||||
|
'ent': 12,
|
||||||
|
' se': 13,
|
||||||
|
'a d': 14,
|
||||||
|
's d': 15,
|
||||||
|
'e a': 16,
|
||||||
|
'es ': 17,
|
||||||
|
' pr': 18,
|
||||||
|
'ra ': 19,
|
||||||
|
'da ': 20,
|
||||||
|
' es': 21,
|
||||||
|
' pa': 22,
|
||||||
|
'to ': 23,
|
||||||
|
' o ': 24,
|
||||||
|
'em ': 25,
|
||||||
|
'con': 26,
|
||||||
|
'o p': 27,
|
||||||
|
' do': 28,
|
||||||
|
'est': 29,
|
||||||
|
'nte': 30,
|
||||||
|
'ção': 31,
|
||||||
|
' da': 32,
|
||||||
|
' re': 33,
|
||||||
|
'ma ': 34,
|
||||||
|
'par': 35,
|
||||||
|
' te': 36,
|
||||||
|
'ara': 37,
|
||||||
|
'ida': 38,
|
||||||
|
' e ': 39,
|
||||||
|
'ade': 40,
|
||||||
|
'is ': 41,
|
||||||
|
' um': 42,
|
||||||
|
' po': 43,
|
||||||
|
'a a': 44,
|
||||||
|
'a p': 45,
|
||||||
|
'dad': 46,
|
||||||
|
'no ': 47,
|
||||||
|
'te ': 48,
|
||||||
|
' no': 49,
|
||||||
|
'açã': 50,
|
||||||
|
'pro': 51,
|
||||||
|
'al ': 52,
|
||||||
|
'com': 53,
|
||||||
|
'e d': 54,
|
||||||
|
's a': 55,
|
||||||
|
' as': 56,
|
||||||
|
'a c': 57,
|
||||||
|
'er ': 58,
|
||||||
|
'men': 59,
|
||||||
|
's e': 60,
|
||||||
|
'ais': 61,
|
||||||
|
'nto': 62,
|
||||||
|
'res': 63,
|
||||||
|
'a s': 64,
|
||||||
|
'ado': 65,
|
||||||
|
'ist': 66,
|
||||||
|
's p': 67,
|
||||||
|
'tem': 68,
|
||||||
|
'e c': 69,
|
||||||
|
'e s': 70,
|
||||||
|
'ia ': 71,
|
||||||
|
'o s': 72,
|
||||||
|
'o a': 73,
|
||||||
|
'o c': 74,
|
||||||
|
'e p': 75,
|
||||||
|
'sta': 76,
|
||||||
|
'ta ': 77,
|
||||||
|
'tra': 78,
|
||||||
|
'ura': 79,
|
||||||
|
' di': 80,
|
||||||
|
' pe': 81,
|
||||||
|
'ar ': 82,
|
||||||
|
'e e': 83,
|
||||||
|
'ser': 84,
|
||||||
|
'uma': 85,
|
||||||
|
'mos': 86,
|
||||||
|
'se ': 87,
|
||||||
|
' ca': 88,
|
||||||
|
'o e': 89,
|
||||||
|
' na': 90,
|
||||||
|
'a e': 91,
|
||||||
|
'des': 92,
|
||||||
|
'ont': 93,
|
||||||
|
'por': 94,
|
||||||
|
' in': 95,
|
||||||
|
' ma': 96,
|
||||||
|
'ect': 97,
|
||||||
|
'o q': 98,
|
||||||
|
'ria': 99,
|
||||||
|
's c': 100,
|
||||||
|
'ste': 101,
|
||||||
|
'ver': 102,
|
||||||
|
'cia': 103,
|
||||||
|
'dos': 104,
|
||||||
|
'ica': 105,
|
||||||
|
'str': 106,
|
||||||
|
' ao': 107,
|
||||||
|
' em': 108,
|
||||||
|
'das': 109,
|
||||||
|
'e t': 110,
|
||||||
|
'ito': 111,
|
||||||
|
'iza': 112,
|
||||||
|
'pre': 113,
|
||||||
|
'tos': 114,
|
||||||
|
' nã': 115,
|
||||||
|
'ada': 116,
|
||||||
|
'não': 117,
|
||||||
|
'ess': 118,
|
||||||
|
'eve': 119,
|
||||||
|
'or ': 120,
|
||||||
|
'ran': 121,
|
||||||
|
's n': 122,
|
||||||
|
's t': 123,
|
||||||
|
'tur': 124,
|
||||||
|
' ac': 125,
|
||||||
|
' fa': 126,
|
||||||
|
'a r': 127,
|
||||||
|
'ens': 128,
|
||||||
|
'eri': 129,
|
||||||
|
'na ': 130,
|
||||||
|
'sso': 131,
|
||||||
|
' si': 132,
|
||||||
|
' é ': 133,
|
||||||
|
'bra': 134,
|
||||||
|
'esp': 135,
|
||||||
|
'mo ': 136,
|
||||||
|
'nos': 137,
|
||||||
|
'ro ': 138,
|
||||||
|
'um ': 139,
|
||||||
|
'a n': 140,
|
||||||
|
'ao ': 141,
|
||||||
|
'ico': 142,
|
||||||
|
'liz': 143,
|
||||||
|
'min': 144,
|
||||||
|
'o n': 145,
|
||||||
|
'ons': 146,
|
||||||
|
'pri': 147,
|
||||||
|
'ten': 148,
|
||||||
|
'tic': 149,
|
||||||
|
'ões': 150,
|
||||||
|
' tr': 151,
|
||||||
|
'a m': 152,
|
||||||
|
'aga': 153,
|
||||||
|
'e n': 154,
|
||||||
|
'ili': 155,
|
||||||
|
'ime': 156,
|
||||||
|
'm a': 157,
|
||||||
|
'nci': 158,
|
||||||
|
'nha': 159,
|
||||||
|
'nta': 160,
|
||||||
|
'spe': 161,
|
||||||
|
'tiv': 162,
|
||||||
|
'am ': 163,
|
||||||
|
'ano': 164,
|
||||||
|
'arc': 165,
|
||||||
|
'ass': 166,
|
||||||
|
'cer': 167,
|
||||||
|
'e o': 168,
|
||||||
|
'ece': 169,
|
||||||
|
'emo': 170,
|
||||||
|
'ga ': 171,
|
||||||
|
'o m': 172,
|
||||||
|
'rag': 173,
|
||||||
|
'so ': 174,
|
||||||
|
'são': 175,
|
||||||
|
' au': 176,
|
||||||
|
' os': 177,
|
||||||
|
' sa': 178,
|
||||||
|
'ali': 179,
|
||||||
|
'ca ': 180,
|
||||||
|
'ema': 181,
|
||||||
|
'emp': 182,
|
||||||
|
'ici': 183,
|
||||||
|
'ido': 184,
|
||||||
|
'inh': 185,
|
||||||
|
'iss': 186,
|
||||||
|
'l d': 187,
|
||||||
|
'la ': 188,
|
||||||
|
'lic': 189,
|
||||||
|
'm c': 190,
|
||||||
|
'mai': 191,
|
||||||
|
'onc': 192,
|
||||||
|
'pec': 193,
|
||||||
|
'ram': 194,
|
||||||
|
's q': 195,
|
||||||
|
' ci': 196,
|
||||||
|
' en': 197,
|
||||||
|
' fo': 198,
|
||||||
|
'a o': 199,
|
||||||
|
'ame': 200,
|
||||||
|
'car': 201,
|
||||||
|
'co ': 202,
|
||||||
|
'der': 203,
|
||||||
|
'eir': 204,
|
||||||
|
'ho ': 205,
|
||||||
|
'io ': 206,
|
||||||
|
'om ': 207,
|
||||||
|
'ora': 208,
|
||||||
|
'r a': 209,
|
||||||
|
'sen': 210,
|
||||||
|
'ter': 211,
|
||||||
|
' br': 212,
|
||||||
|
' ex': 213,
|
||||||
|
'a u': 214,
|
||||||
|
'cul': 215,
|
||||||
|
'dev': 216,
|
||||||
|
'e u': 217,
|
||||||
|
'ha ': 218,
|
||||||
|
'mpr': 219,
|
||||||
|
'nce': 220,
|
||||||
|
'oca': 221,
|
||||||
|
'ove': 222,
|
||||||
|
'rio': 223,
|
||||||
|
's o': 224,
|
||||||
|
'sa ': 225,
|
||||||
|
'sem': 226,
|
||||||
|
'tes': 227,
|
||||||
|
'uni': 228,
|
||||||
|
'ven': 229,
|
||||||
|
'zaç': 230,
|
||||||
|
'çõe': 231,
|
||||||
|
' ad': 232,
|
||||||
|
' al': 233,
|
||||||
|
' an': 234,
|
||||||
|
' mi': 235,
|
||||||
|
' mo': 236,
|
||||||
|
' ve': 237,
|
||||||
|
' à ': 238,
|
||||||
|
'a i': 239,
|
||||||
|
'a q': 240,
|
||||||
|
'ala': 241,
|
||||||
|
'amo': 242,
|
||||||
|
'bli': 243,
|
||||||
|
'cen': 244,
|
||||||
|
'col': 245,
|
||||||
|
'cos': 246,
|
||||||
|
'cto': 247,
|
||||||
|
'e m': 248,
|
||||||
|
'e v': 249,
|
||||||
|
'ede': 250,
|
||||||
|
'gás': 251,
|
||||||
|
'ias': 252,
|
||||||
|
'ita': 253,
|
||||||
|
'iva': 254,
|
||||||
|
'ndo': 255,
|
||||||
|
'o t': 256,
|
||||||
|
'ore': 257,
|
||||||
|
'r d': 258,
|
||||||
|
'ral': 259,
|
||||||
|
'rea': 260,
|
||||||
|
's f': 261,
|
||||||
|
'sid': 262,
|
||||||
|
'tro': 263,
|
||||||
|
'vel': 264,
|
||||||
|
'vid': 265,
|
||||||
|
'ás ': 266,
|
||||||
|
' ap': 267,
|
||||||
|
' ar': 268,
|
||||||
|
' ce': 269,
|
||||||
|
' ou': 270,
|
||||||
|
' pú': 271,
|
||||||
|
' so': 272,
|
||||||
|
' vi': 273,
|
||||||
|
'a f': 274,
|
||||||
|
'act': 275,
|
||||||
|
'arr': 276,
|
||||||
|
'bil': 277,
|
||||||
|
'cam': 278,
|
||||||
|
'e f': 279,
|
||||||
|
'e i': 280,
|
||||||
|
'el ': 281,
|
||||||
|
'for': 282,
|
||||||
|
'lem': 283,
|
||||||
|
'lid': 284,
|
||||||
|
'lo ': 285,
|
||||||
|
'm d': 286,
|
||||||
|
'mar': 287,
|
||||||
|
'nde': 288,
|
||||||
|
'o o': 289,
|
||||||
|
'omo': 290,
|
||||||
|
'ort': 291,
|
||||||
|
'per': 292,
|
||||||
|
'púb': 293,
|
||||||
|
'r u': 294,
|
||||||
|
'rei': 295,
|
||||||
|
'rem': 296,
|
||||||
|
'ros': 297,
|
||||||
|
'rre': 298,
|
||||||
|
'ssi': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/pt_br.py
Normal file
303
libs/guess_language/data/models/pt_br.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'eq ': 0,
|
||||||
|
'ent': 1,
|
||||||
|
' en': 2,
|
||||||
|
'q e': 3,
|
||||||
|
'q i': 4,
|
||||||
|
'g e': 5,
|
||||||
|
'g i': 6,
|
||||||
|
'ng ': 7,
|
||||||
|
' id': 8,
|
||||||
|
'ida': 9,
|
||||||
|
'nte': 10,
|
||||||
|
'te ': 11,
|
||||||
|
' es': 12,
|
||||||
|
' in': 13,
|
||||||
|
'ade': 14,
|
||||||
|
'ag ': 15,
|
||||||
|
'dad': 16,
|
||||||
|
'de ': 17,
|
||||||
|
'ia ': 18,
|
||||||
|
'ing': 19,
|
||||||
|
' br': 20,
|
||||||
|
' sa': 21,
|
||||||
|
'est': 22,
|
||||||
|
'inq': 23,
|
||||||
|
'lin': 24,
|
||||||
|
'mo ': 25,
|
||||||
|
'nq ': 26,
|
||||||
|
'o a': 27,
|
||||||
|
'seq': 28,
|
||||||
|
' co': 29,
|
||||||
|
' li': 30,
|
||||||
|
' ni': 31,
|
||||||
|
' o ': 32,
|
||||||
|
'a a': 33,
|
||||||
|
'a c': 34,
|
||||||
|
'ado': 35,
|
||||||
|
'asi': 36,
|
||||||
|
'bra': 37,
|
||||||
|
'dor': 38,
|
||||||
|
'iq ': 39,
|
||||||
|
'nta': 40,
|
||||||
|
'o b': 41,
|
||||||
|
'or ': 42,
|
||||||
|
'q n': 43,
|
||||||
|
'ras': 44,
|
||||||
|
'sil': 45,
|
||||||
|
'str': 46,
|
||||||
|
'ta ': 47,
|
||||||
|
'tre': 48,
|
||||||
|
'us ': 49,
|
||||||
|
' a ': 50,
|
||||||
|
' ag': 51,
|
||||||
|
' an': 52,
|
||||||
|
' ca': 53,
|
||||||
|
' e ': 54,
|
||||||
|
' eq': 55,
|
||||||
|
' g ': 56,
|
||||||
|
' i ': 57,
|
||||||
|
' ir': 58,
|
||||||
|
' nc': 59,
|
||||||
|
' q ': 60,
|
||||||
|
' se': 61,
|
||||||
|
' ve': 62,
|
||||||
|
'ant': 63,
|
||||||
|
'ar ': 64,
|
||||||
|
'cia': 65,
|
||||||
|
'con': 66,
|
||||||
|
'e a': 67,
|
||||||
|
'eir': 68,
|
||||||
|
'el ': 69,
|
||||||
|
'ig ': 70,
|
||||||
|
'ili': 71,
|
||||||
|
'imo': 72,
|
||||||
|
'io ': 73,
|
||||||
|
'ir ': 74,
|
||||||
|
'nci': 75,
|
||||||
|
'o t': 76,
|
||||||
|
'ro ': 77,
|
||||||
|
'vel': 78,
|
||||||
|
' ap': 79,
|
||||||
|
' bo': 80,
|
||||||
|
' de': 81,
|
||||||
|
' fr': 82,
|
||||||
|
' tr': 83,
|
||||||
|
'a b': 84,
|
||||||
|
'a e': 85,
|
||||||
|
'a g': 86,
|
||||||
|
'a v': 87,
|
||||||
|
'apo': 88,
|
||||||
|
'as ': 89,
|
||||||
|
'bus': 90,
|
||||||
|
'ca ': 91,
|
||||||
|
'cet': 92,
|
||||||
|
'cin': 93,
|
||||||
|
'des': 94,
|
||||||
|
'e b': 95,
|
||||||
|
'e s': 96,
|
||||||
|
'eta': 97,
|
||||||
|
'fre': 98,
|
||||||
|
'i a': 99,
|
||||||
|
'ibu': 100,
|
||||||
|
'il ': 101,
|
||||||
|
'iro': 102,
|
||||||
|
'la ': 103,
|
||||||
|
'liq': 104,
|
||||||
|
'nib': 105,
|
||||||
|
'nti': 106,
|
||||||
|
'o c': 107,
|
||||||
|
'o q': 108,
|
||||||
|
'os ': 109,
|
||||||
|
'ra ': 110,
|
||||||
|
're ': 111,
|
||||||
|
'req': 112,
|
||||||
|
's a': 113,
|
||||||
|
's s': 114,
|
||||||
|
'san': 115,
|
||||||
|
'sim': 116,
|
||||||
|
'tar': 117,
|
||||||
|
'to ': 118,
|
||||||
|
'ult': 119,
|
||||||
|
' ba': 120,
|
||||||
|
' ci': 121,
|
||||||
|
' el': 122,
|
||||||
|
' em': 123,
|
||||||
|
' fi': 124,
|
||||||
|
' gr': 125,
|
||||||
|
' gu': 126,
|
||||||
|
' ia': 127,
|
||||||
|
' mu': 128,
|
||||||
|
' pe': 129,
|
||||||
|
' po': 130,
|
||||||
|
' re': 131,
|
||||||
|
' ri': 132,
|
||||||
|
' si': 133,
|
||||||
|
' su': 134,
|
||||||
|
' te': 135,
|
||||||
|
' vi': 136,
|
||||||
|
'a o': 137,
|
||||||
|
'a s': 138,
|
||||||
|
'abe': 139,
|
||||||
|
'alc': 140,
|
||||||
|
'and': 141,
|
||||||
|
'ara': 142,
|
||||||
|
'arg': 143,
|
||||||
|
'ari': 144,
|
||||||
|
'ben': 145,
|
||||||
|
'boc': 146,
|
||||||
|
'car': 147,
|
||||||
|
'co ': 148,
|
||||||
|
'do ': 149,
|
||||||
|
'e f': 150,
|
||||||
|
'e g': 151,
|
||||||
|
'e l': 152,
|
||||||
|
'e o': 153,
|
||||||
|
'em ': 154,
|
||||||
|
'emo': 155,
|
||||||
|
'en ': 156,
|
||||||
|
'es ': 157,
|
||||||
|
'esp': 158,
|
||||||
|
'exe': 159,
|
||||||
|
'fic': 160,
|
||||||
|
'g n': 161,
|
||||||
|
'g s': 162,
|
||||||
|
'gra': 163,
|
||||||
|
'gua': 164,
|
||||||
|
'ias': 165,
|
||||||
|
'ica': 166,
|
||||||
|
'idi': 167,
|
||||||
|
'ila': 168,
|
||||||
|
'ile': 169,
|
||||||
|
'inh': 170,
|
||||||
|
'l b': 171,
|
||||||
|
'l e': 172,
|
||||||
|
'lei': 173,
|
||||||
|
'loq': 174,
|
||||||
|
'mos': 175,
|
||||||
|
'mul': 176,
|
||||||
|
'nad': 177,
|
||||||
|
'nio': 178,
|
||||||
|
'nt ': 179,
|
||||||
|
'nto': 180,
|
||||||
|
'o g': 181,
|
||||||
|
'o r': 182,
|
||||||
|
'oce': 183,
|
||||||
|
'ont': 184,
|
||||||
|
'oq ': 185,
|
||||||
|
'pos': 186,
|
||||||
|
'q v': 187,
|
||||||
|
'r b': 188,
|
||||||
|
'r e': 189,
|
||||||
|
'r i': 190,
|
||||||
|
'r s': 191,
|
||||||
|
'rad': 192,
|
||||||
|
'ran': 193,
|
||||||
|
'rem': 194,
|
||||||
|
'rg ': 195,
|
||||||
|
'ria': 196,
|
||||||
|
'rio': 197,
|
||||||
|
's e': 198,
|
||||||
|
's p': 199,
|
||||||
|
'sta': 200,
|
||||||
|
'sti': 201,
|
||||||
|
'tig': 202,
|
||||||
|
'til': 203,
|
||||||
|
'tra': 204,
|
||||||
|
'ua ': 205,
|
||||||
|
'ue ': 206,
|
||||||
|
'va ': 207,
|
||||||
|
'xeq': 208,
|
||||||
|
" ' ": 209,
|
||||||
|
' ab': 210,
|
||||||
|
' ad': 211,
|
||||||
|
' ae': 212,
|
||||||
|
' al': 213,
|
||||||
|
' am': 214,
|
||||||
|
' aq': 215,
|
||||||
|
' ar': 216,
|
||||||
|
' b ': 217,
|
||||||
|
' bi': 218,
|
||||||
|
' bl': 219,
|
||||||
|
' bu': 220,
|
||||||
|
' cc': 221,
|
||||||
|
' ch': 222,
|
||||||
|
' di': 223,
|
||||||
|
' et': 224,
|
||||||
|
' ex': 225,
|
||||||
|
' fa': 226,
|
||||||
|
' ic': 227,
|
||||||
|
' il': 228,
|
||||||
|
' im': 229,
|
||||||
|
' is': 230,
|
||||||
|
' it': 231,
|
||||||
|
' ll': 232,
|
||||||
|
' m ': 233,
|
||||||
|
' me': 234,
|
||||||
|
' na': 235,
|
||||||
|
' ne': 236,
|
||||||
|
' ng': 237,
|
||||||
|
' nu': 238,
|
||||||
|
' ob': 239,
|
||||||
|
' ou': 240,
|
||||||
|
' pi': 241,
|
||||||
|
' qu': 242,
|
||||||
|
' ss': 243,
|
||||||
|
' st': 244,
|
||||||
|
' ti': 245,
|
||||||
|
' ub': 246,
|
||||||
|
' un': 247,
|
||||||
|
' v ': 248,
|
||||||
|
' x ': 249,
|
||||||
|
"' c": 250,
|
||||||
|
'a d': 251,
|
||||||
|
'a f': 252,
|
||||||
|
'a i': 253,
|
||||||
|
'a n': 254,
|
||||||
|
'a p': 255,
|
||||||
|
'a t': 256,
|
||||||
|
'abr': 257,
|
||||||
|
'aci': 258,
|
||||||
|
'ad ': 259,
|
||||||
|
'ada': 260,
|
||||||
|
'adr': 261,
|
||||||
|
'aer': 262,
|
||||||
|
'afe': 263,
|
||||||
|
'alv': 264,
|
||||||
|
'amb': 265,
|
||||||
|
'amp': 266,
|
||||||
|
'an ': 267,
|
||||||
|
'ana': 268,
|
||||||
|
'ang': 269,
|
||||||
|
'anh': 270,
|
||||||
|
'ani': 271,
|
||||||
|
'ano': 272,
|
||||||
|
'anq': 273,
|
||||||
|
'apa': 274,
|
||||||
|
'aq ': 275,
|
||||||
|
'ati': 276,
|
||||||
|
'ato': 277,
|
||||||
|
'azi': 278,
|
||||||
|
'b n': 279,
|
||||||
|
'ban': 280,
|
||||||
|
'bar': 281,
|
||||||
|
'big': 282,
|
||||||
|
'bil': 283,
|
||||||
|
'biq': 284,
|
||||||
|
'bli': 285,
|
||||||
|
'blu': 286,
|
||||||
|
'bon': 287,
|
||||||
|
'bre': 288,
|
||||||
|
'bri': 289,
|
||||||
|
'bse': 290,
|
||||||
|
'buc': 291,
|
||||||
|
'c f': 292,
|
||||||
|
'c i': 293,
|
||||||
|
'cad': 294,
|
||||||
|
'caf': 295,
|
||||||
|
'cag': 296,
|
||||||
|
'cal': 297,
|
||||||
|
'can': 298,
|
||||||
|
'cc ': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/pt_pt.py
Normal file
303
libs/guess_language/data/models/pt_pt.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'equ': 0,
|
||||||
|
'ent': 1,
|
||||||
|
'que': 2,
|
||||||
|
'qui': 3,
|
||||||
|
'gui': 4,
|
||||||
|
'uen': 5,
|
||||||
|
' li': 6,
|
||||||
|
'ngu': 7,
|
||||||
|
'qu ': 8,
|
||||||
|
'uid': 9,
|
||||||
|
' co': 10,
|
||||||
|
' ve': 11,
|
||||||
|
'de ': 12,
|
||||||
|
'gue': 13,
|
||||||
|
'ida': 14,
|
||||||
|
'nte': 15,
|
||||||
|
'o a': 16,
|
||||||
|
'a a': 17,
|
||||||
|
'ade': 18,
|
||||||
|
'dad': 19,
|
||||||
|
'el ': 20,
|
||||||
|
'ing': 21,
|
||||||
|
'mo ': 22,
|
||||||
|
'nqu': 23,
|
||||||
|
'nta': 24,
|
||||||
|
'seq': 25,
|
||||||
|
'u n': 26,
|
||||||
|
'vel': 27,
|
||||||
|
' de': 28,
|
||||||
|
' o ': 29,
|
||||||
|
' se': 30,
|
||||||
|
'a c': 31,
|
||||||
|
'ado': 32,
|
||||||
|
'ar ': 33,
|
||||||
|
'est': 34,
|
||||||
|
'ia ': 35,
|
||||||
|
'inq': 36,
|
||||||
|
'io ': 37,
|
||||||
|
'iqu': 38,
|
||||||
|
'lin': 39,
|
||||||
|
'o c': 40,
|
||||||
|
'o p': 41,
|
||||||
|
'ort': 42,
|
||||||
|
'por': 43,
|
||||||
|
'ta ': 44,
|
||||||
|
'te ': 45,
|
||||||
|
' ag': 46,
|
||||||
|
' eq': 47,
|
||||||
|
' nc': 48,
|
||||||
|
' pi': 49,
|
||||||
|
' po': 50,
|
||||||
|
' sa': 51,
|
||||||
|
'a d': 52,
|
||||||
|
'a e': 53,
|
||||||
|
'ant': 54,
|
||||||
|
'as ': 55,
|
||||||
|
'ca ': 56,
|
||||||
|
'cia': 57,
|
||||||
|
'des': 58,
|
||||||
|
'do ': 59,
|
||||||
|
'gu ': 60,
|
||||||
|
'imo': 61,
|
||||||
|
'l p': 62,
|
||||||
|
'nci': 63,
|
||||||
|
'ro ': 64,
|
||||||
|
'rtu': 65,
|
||||||
|
'str': 66,
|
||||||
|
'tug': 67,
|
||||||
|
'u s': 68,
|
||||||
|
'ues': 69,
|
||||||
|
'ui ': 70,
|
||||||
|
' a ': 71,
|
||||||
|
' an': 72,
|
||||||
|
' ap': 73,
|
||||||
|
' ba': 74,
|
||||||
|
' bi': 75,
|
||||||
|
' ca': 76,
|
||||||
|
' fr': 77,
|
||||||
|
' gu': 78,
|
||||||
|
' in': 79,
|
||||||
|
' pe': 80,
|
||||||
|
' qu': 81,
|
||||||
|
'agu': 82,
|
||||||
|
'apa': 83,
|
||||||
|
'con': 84,
|
||||||
|
'dor': 85,
|
||||||
|
'e f': 86,
|
||||||
|
'e g': 87,
|
||||||
|
'eir': 88,
|
||||||
|
'fre': 89,
|
||||||
|
'ho ': 90,
|
||||||
|
'i a': 91,
|
||||||
|
'ica': 92,
|
||||||
|
'igu': 93,
|
||||||
|
'iro': 94,
|
||||||
|
'liq': 95,
|
||||||
|
'nti': 96,
|
||||||
|
'o b': 97,
|
||||||
|
'o l': 98,
|
||||||
|
'o s': 99,
|
||||||
|
'or ': 100,
|
||||||
|
'r o': 101,
|
||||||
|
'ra ': 102,
|
||||||
|
'req': 103,
|
||||||
|
's c': 104,
|
||||||
|
'sim': 105,
|
||||||
|
'tar': 106,
|
||||||
|
'to ': 107,
|
||||||
|
'ue ': 108,
|
||||||
|
'uin': 109,
|
||||||
|
'ult': 110,
|
||||||
|
' ci': 111,
|
||||||
|
' en': 112,
|
||||||
|
' ho': 113,
|
||||||
|
' mu': 114,
|
||||||
|
' ni': 115,
|
||||||
|
' re': 116,
|
||||||
|
' s ': 117,
|
||||||
|
' si': 118,
|
||||||
|
' su': 119,
|
||||||
|
'a s': 120,
|
||||||
|
'a v': 121,
|
||||||
|
'abe': 122,
|
||||||
|
'ag ': 123,
|
||||||
|
'al ': 124,
|
||||||
|
'and': 125,
|
||||||
|
'anh': 126,
|
||||||
|
'apo': 127,
|
||||||
|
'ata': 128,
|
||||||
|
'ban': 129,
|
||||||
|
'ben': 130,
|
||||||
|
'bic': 131,
|
||||||
|
'boi': 132,
|
||||||
|
'cap': 133,
|
||||||
|
'car': 134,
|
||||||
|
'cin': 135,
|
||||||
|
'co ': 136,
|
||||||
|
'com': 137,
|
||||||
|
'cto': 138,
|
||||||
|
'dei': 139,
|
||||||
|
'e b': 140,
|
||||||
|
'e o': 141,
|
||||||
|
'e s': 142,
|
||||||
|
'eca': 143,
|
||||||
|
'en ': 144,
|
||||||
|
'er ': 145,
|
||||||
|
'es ': 146,
|
||||||
|
'exe': 147,
|
||||||
|
'fic': 148,
|
||||||
|
'for': 149,
|
||||||
|
'gal': 150,
|
||||||
|
'gra': 151,
|
||||||
|
'ias': 152,
|
||||||
|
'ich': 153,
|
||||||
|
'ico': 154,
|
||||||
|
'idi': 155,
|
||||||
|
'ili': 156,
|
||||||
|
'ir ': 157,
|
||||||
|
'ira': 158,
|
||||||
|
'isb': 159,
|
||||||
|
'la ': 160,
|
||||||
|
'lis': 161,
|
||||||
|
'mbo': 162,
|
||||||
|
'mul': 163,
|
||||||
|
'na ': 164,
|
||||||
|
'nho': 165,
|
||||||
|
'nio': 166,
|
||||||
|
'nt ': 167,
|
||||||
|
'o q': 168,
|
||||||
|
'o r': 169,
|
||||||
|
'o t': 170,
|
||||||
|
'oc ': 171,
|
||||||
|
'oio': 172,
|
||||||
|
'omb': 173,
|
||||||
|
'oo ': 174,
|
||||||
|
'os ': 175,
|
||||||
|
'par': 176,
|
||||||
|
'pe ': 177,
|
||||||
|
'r b': 178,
|
||||||
|
'r e': 179,
|
||||||
|
'r s': 180,
|
||||||
|
'ran': 181,
|
||||||
|
're ': 182,
|
||||||
|
'rec': 183,
|
||||||
|
's a': 184,
|
||||||
|
's s': 185,
|
||||||
|
'san': 186,
|
||||||
|
'sbo': 187,
|
||||||
|
'so ': 188,
|
||||||
|
'sta': 189,
|
||||||
|
'tan': 190,
|
||||||
|
'tra': 191,
|
||||||
|
'tre': 192,
|
||||||
|
'u v': 193,
|
||||||
|
'uga': 194,
|
||||||
|
'ugu': 195,
|
||||||
|
'xeq': 196,
|
||||||
|
' ab': 197,
|
||||||
|
' ad': 198,
|
||||||
|
' al': 199,
|
||||||
|
' am': 200,
|
||||||
|
' aq': 201,
|
||||||
|
' ar': 202,
|
||||||
|
' au': 203,
|
||||||
|
' b ': 204,
|
||||||
|
' bo': 205,
|
||||||
|
' c ': 206,
|
||||||
|
' ch': 207,
|
||||||
|
' ct': 208,
|
||||||
|
' cu': 209,
|
||||||
|
' el': 210,
|
||||||
|
' es': 211,
|
||||||
|
' ex': 212,
|
||||||
|
' fa': 213,
|
||||||
|
' fi': 214,
|
||||||
|
' ga': 215,
|
||||||
|
' gr': 216,
|
||||||
|
' id': 217,
|
||||||
|
' ir': 218,
|
||||||
|
' ne': 219,
|
||||||
|
' ng': 220,
|
||||||
|
' nu': 221,
|
||||||
|
' ob': 222,
|
||||||
|
' oo': 223,
|
||||||
|
' pa': 224,
|
||||||
|
' ps': 225,
|
||||||
|
' pt': 226,
|
||||||
|
' r ': 227,
|
||||||
|
' ra': 228,
|
||||||
|
' ri': 229,
|
||||||
|
' ss': 230,
|
||||||
|
' st': 231,
|
||||||
|
' ta': 232,
|
||||||
|
' te': 233,
|
||||||
|
' tr': 234,
|
||||||
|
' ub': 235,
|
||||||
|
' un': 236,
|
||||||
|
' vi': 237,
|
||||||
|
' vo': 238,
|
||||||
|
'a f': 239,
|
||||||
|
'a i': 240,
|
||||||
|
'a l': 241,
|
||||||
|
'a m': 242,
|
||||||
|
'a o': 243,
|
||||||
|
'a r': 244,
|
||||||
|
'ach': 245,
|
||||||
|
'aci': 246,
|
||||||
|
'act': 247,
|
||||||
|
'ad ': 248,
|
||||||
|
'afa': 249,
|
||||||
|
'age': 250,
|
||||||
|
'agr': 251,
|
||||||
|
'alf': 252,
|
||||||
|
'alh': 253,
|
||||||
|
'am ': 254,
|
||||||
|
'amb': 255,
|
||||||
|
'ami': 256,
|
||||||
|
'ana': 257,
|
||||||
|
'ang': 258,
|
||||||
|
'anq': 259,
|
||||||
|
'aqu': 260,
|
||||||
|
'ara': 261,
|
||||||
|
'arb': 262,
|
||||||
|
'arc': 263,
|
||||||
|
'arg': 264,
|
||||||
|
'ari': 265,
|
||||||
|
'arr': 266,
|
||||||
|
'asa': 267,
|
||||||
|
'ati': 268,
|
||||||
|
'aut': 269,
|
||||||
|
'azi': 270,
|
||||||
|
'b n': 271,
|
||||||
|
'bar': 272,
|
||||||
|
'bat': 273,
|
||||||
|
'ber': 274,
|
||||||
|
'big': 275,
|
||||||
|
'bil': 276,
|
||||||
|
'biq': 277,
|
||||||
|
'bli': 278,
|
||||||
|
'boa': 279,
|
||||||
|
'boe': 280,
|
||||||
|
'bor': 281,
|
||||||
|
'bse': 282,
|
||||||
|
'c i': 283,
|
||||||
|
'c l': 284,
|
||||||
|
'c p': 285,
|
||||||
|
'cad': 286,
|
||||||
|
'cam': 287,
|
||||||
|
'cas': 288,
|
||||||
|
'ch ': 289,
|
||||||
|
'cha': 290,
|
||||||
|
'che': 291,
|
||||||
|
'chi': 292,
|
||||||
|
'cio': 293,
|
||||||
|
'coc': 294,
|
||||||
|
'coi': 295,
|
||||||
|
'cou': 296,
|
||||||
|
'ctr': 297,
|
||||||
|
'cue': 298,
|
||||||
|
'cul': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/ro.py
Normal file
303
libs/guess_language/data/models/ro.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
' de': 0,
|
||||||
|
' în': 1,
|
||||||
|
'de ': 2,
|
||||||
|
' a ': 3,
|
||||||
|
'ul ': 4,
|
||||||
|
' co': 5,
|
||||||
|
'în ': 6,
|
||||||
|
're ': 7,
|
||||||
|
'e d': 8,
|
||||||
|
'ea ': 9,
|
||||||
|
' di': 10,
|
||||||
|
' pr': 11,
|
||||||
|
'le ': 12,
|
||||||
|
'şi ': 13,
|
||||||
|
'are': 14,
|
||||||
|
'at ': 15,
|
||||||
|
'con': 16,
|
||||||
|
'ui ': 17,
|
||||||
|
' şi': 18,
|
||||||
|
'i d': 19,
|
||||||
|
'ii ': 20,
|
||||||
|
' cu': 21,
|
||||||
|
'e a': 22,
|
||||||
|
'lui': 23,
|
||||||
|
'ern': 24,
|
||||||
|
'te ': 25,
|
||||||
|
'cu ': 26,
|
||||||
|
' la': 27,
|
||||||
|
'a c': 28,
|
||||||
|
'că ': 29,
|
||||||
|
'din': 30,
|
||||||
|
'e c': 31,
|
||||||
|
'or ': 32,
|
||||||
|
'ulu': 33,
|
||||||
|
'ne ': 34,
|
||||||
|
'ter': 35,
|
||||||
|
'la ': 36,
|
||||||
|
'să ': 37,
|
||||||
|
'tat': 38,
|
||||||
|
'tre': 39,
|
||||||
|
' ac': 40,
|
||||||
|
' să': 41,
|
||||||
|
'est': 42,
|
||||||
|
'st ': 43,
|
||||||
|
'tă ': 44,
|
||||||
|
' ca': 45,
|
||||||
|
' ma': 46,
|
||||||
|
' pe': 47,
|
||||||
|
'cur': 48,
|
||||||
|
'ist': 49,
|
||||||
|
'mân': 50,
|
||||||
|
'a d': 51,
|
||||||
|
'i c': 52,
|
||||||
|
'nat': 53,
|
||||||
|
' ce': 54,
|
||||||
|
'i a': 55,
|
||||||
|
'ia ': 56,
|
||||||
|
'in ': 57,
|
||||||
|
'scu': 58,
|
||||||
|
' mi': 59,
|
||||||
|
'ato': 60,
|
||||||
|
'aţi': 61,
|
||||||
|
'ie ': 62,
|
||||||
|
' re': 63,
|
||||||
|
' se': 64,
|
||||||
|
'a a': 65,
|
||||||
|
'int': 66,
|
||||||
|
'ntr': 67,
|
||||||
|
'tru': 68,
|
||||||
|
'uri': 69,
|
||||||
|
'ă a': 70,
|
||||||
|
' fo': 71,
|
||||||
|
' pa': 72,
|
||||||
|
'ate': 73,
|
||||||
|
'ini': 74,
|
||||||
|
'tul': 75,
|
||||||
|
'ent': 76,
|
||||||
|
'min': 77,
|
||||||
|
'pre': 78,
|
||||||
|
'pro': 79,
|
||||||
|
'a p': 80,
|
||||||
|
'e p': 81,
|
||||||
|
'e s': 82,
|
||||||
|
'ei ': 83,
|
||||||
|
'nă ': 84,
|
||||||
|
'par': 85,
|
||||||
|
'rna': 86,
|
||||||
|
'rul': 87,
|
||||||
|
'tor': 88,
|
||||||
|
' in': 89,
|
||||||
|
' ro': 90,
|
||||||
|
' tr': 91,
|
||||||
|
' un': 92,
|
||||||
|
'al ': 93,
|
||||||
|
'ale': 94,
|
||||||
|
'art': 95,
|
||||||
|
'ce ': 96,
|
||||||
|
'e e': 97,
|
||||||
|
'e î': 98,
|
||||||
|
'fos': 99,
|
||||||
|
'ita': 100,
|
||||||
|
'nte': 101,
|
||||||
|
'omâ': 102,
|
||||||
|
'ost': 103,
|
||||||
|
'rom': 104,
|
||||||
|
'ru ': 105,
|
||||||
|
'str': 106,
|
||||||
|
'ver': 107,
|
||||||
|
' ex': 108,
|
||||||
|
' na': 109,
|
||||||
|
'a f': 110,
|
||||||
|
'lor': 111,
|
||||||
|
'nis': 112,
|
||||||
|
'rea': 113,
|
||||||
|
'rit': 114,
|
||||||
|
' al': 115,
|
||||||
|
' eu': 116,
|
||||||
|
' no': 117,
|
||||||
|
'ace': 118,
|
||||||
|
'cer': 119,
|
||||||
|
'ile': 120,
|
||||||
|
'nal': 121,
|
||||||
|
'pri': 122,
|
||||||
|
'ri ': 123,
|
||||||
|
'sta': 124,
|
||||||
|
'ste': 125,
|
||||||
|
'ţie': 126,
|
||||||
|
' au': 127,
|
||||||
|
' da': 128,
|
||||||
|
' ju': 129,
|
||||||
|
' po': 130,
|
||||||
|
'ar ': 131,
|
||||||
|
'au ': 132,
|
||||||
|
'ele': 133,
|
||||||
|
'ere': 134,
|
||||||
|
'eri': 135,
|
||||||
|
'ina': 136,
|
||||||
|
'n a': 137,
|
||||||
|
'n c': 138,
|
||||||
|
'res': 139,
|
||||||
|
'se ': 140,
|
||||||
|
't a': 141,
|
||||||
|
'tea': 142,
|
||||||
|
' că': 143,
|
||||||
|
' do': 144,
|
||||||
|
' fi': 145,
|
||||||
|
'a s': 146,
|
||||||
|
'ată': 147,
|
||||||
|
'com': 148,
|
||||||
|
'e ş': 149,
|
||||||
|
'eur': 150,
|
||||||
|
'guv': 151,
|
||||||
|
'i s': 152,
|
||||||
|
'ice': 153,
|
||||||
|
'ili': 154,
|
||||||
|
'na ': 155,
|
||||||
|
'rec': 156,
|
||||||
|
'rep': 157,
|
||||||
|
'ril': 158,
|
||||||
|
'rne': 159,
|
||||||
|
'rti': 160,
|
||||||
|
'uro': 161,
|
||||||
|
'uve': 162,
|
||||||
|
'ă p': 163,
|
||||||
|
' ar': 164,
|
||||||
|
' o ': 165,
|
||||||
|
' su': 166,
|
||||||
|
' vi': 167,
|
||||||
|
'dec': 168,
|
||||||
|
'dre': 169,
|
||||||
|
'oar': 170,
|
||||||
|
'ons': 171,
|
||||||
|
'pe ': 172,
|
||||||
|
'rii': 173,
|
||||||
|
' ad': 174,
|
||||||
|
' ge': 175,
|
||||||
|
'a m': 176,
|
||||||
|
'a r': 177,
|
||||||
|
'ain': 178,
|
||||||
|
'ali': 179,
|
||||||
|
'car': 180,
|
||||||
|
'cat': 181,
|
||||||
|
'ecu': 182,
|
||||||
|
'ene': 183,
|
||||||
|
'ept': 184,
|
||||||
|
'ext': 185,
|
||||||
|
'ilo': 186,
|
||||||
|
'iu ': 187,
|
||||||
|
'n p': 188,
|
||||||
|
'ori': 189,
|
||||||
|
'sec': 190,
|
||||||
|
'u p': 191,
|
||||||
|
'une': 192,
|
||||||
|
'ă c': 193,
|
||||||
|
'şti': 194,
|
||||||
|
'ţia': 195,
|
||||||
|
' ch': 196,
|
||||||
|
' gu': 197,
|
||||||
|
'ai ': 198,
|
||||||
|
'ani': 199,
|
||||||
|
'cea': 200,
|
||||||
|
'e f': 201,
|
||||||
|
'isc': 202,
|
||||||
|
'l a': 203,
|
||||||
|
'lic': 204,
|
||||||
|
'liu': 205,
|
||||||
|
'mar': 206,
|
||||||
|
'nic': 207,
|
||||||
|
'nt ': 208,
|
||||||
|
'nul': 209,
|
||||||
|
'ris': 210,
|
||||||
|
't c': 211,
|
||||||
|
't p': 212,
|
||||||
|
'tic': 213,
|
||||||
|
'tid': 214,
|
||||||
|
'u a': 215,
|
||||||
|
'ucr': 216,
|
||||||
|
' as': 217,
|
||||||
|
' dr': 218,
|
||||||
|
' fa': 219,
|
||||||
|
' nu': 220,
|
||||||
|
' pu': 221,
|
||||||
|
' to': 222,
|
||||||
|
'cra': 223,
|
||||||
|
'dis': 224,
|
||||||
|
'enţ': 225,
|
||||||
|
'esc': 226,
|
||||||
|
'gen': 227,
|
||||||
|
'it ': 228,
|
||||||
|
'ivi': 229,
|
||||||
|
'l d': 230,
|
||||||
|
'n d': 231,
|
||||||
|
'nd ': 232,
|
||||||
|
'nu ': 233,
|
||||||
|
'ond': 234,
|
||||||
|
'pen': 235,
|
||||||
|
'ral': 236,
|
||||||
|
'riv': 237,
|
||||||
|
'rte': 238,
|
||||||
|
'sti': 239,
|
||||||
|
't d': 240,
|
||||||
|
'ta ': 241,
|
||||||
|
'to ': 242,
|
||||||
|
'uni': 243,
|
||||||
|
'xte': 244,
|
||||||
|
'ând': 245,
|
||||||
|
'îns': 246,
|
||||||
|
'ă s': 247,
|
||||||
|
' bl': 248,
|
||||||
|
' st': 249,
|
||||||
|
' uc': 250,
|
||||||
|
'a b': 251,
|
||||||
|
'a i': 252,
|
||||||
|
'a l': 253,
|
||||||
|
'air': 254,
|
||||||
|
'ast': 255,
|
||||||
|
'bla': 256,
|
||||||
|
'bri': 257,
|
||||||
|
'che': 258,
|
||||||
|
'duc': 259,
|
||||||
|
'dul': 260,
|
||||||
|
'e m': 261,
|
||||||
|
'eas': 262,
|
||||||
|
'edi': 263,
|
||||||
|
'esp': 264,
|
||||||
|
'i l': 265,
|
||||||
|
'i p': 266,
|
||||||
|
'ica': 267,
|
||||||
|
'ică': 268,
|
||||||
|
'ir ': 269,
|
||||||
|
'iun': 270,
|
||||||
|
'jud': 271,
|
||||||
|
'lai': 272,
|
||||||
|
'lul': 273,
|
||||||
|
'mai': 274,
|
||||||
|
'men': 275,
|
||||||
|
'ni ': 276,
|
||||||
|
'pus': 277,
|
||||||
|
'put': 278,
|
||||||
|
'ra ': 279,
|
||||||
|
'rai': 280,
|
||||||
|
'rop': 281,
|
||||||
|
'sil': 282,
|
||||||
|
'ti ': 283,
|
||||||
|
'tra': 284,
|
||||||
|
'u s': 285,
|
||||||
|
'ua ': 286,
|
||||||
|
'ude': 287,
|
||||||
|
'urs': 288,
|
||||||
|
'ân ': 289,
|
||||||
|
'înt': 290,
|
||||||
|
'ţă ': 291,
|
||||||
|
' lu': 292,
|
||||||
|
' mo': 293,
|
||||||
|
' s ': 294,
|
||||||
|
' sa': 295,
|
||||||
|
' sc': 296,
|
||||||
|
'a u': 297,
|
||||||
|
'an ': 298,
|
||||||
|
'atu': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/ru.py
Normal file
303
libs/guess_language/data/models/ru.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
' на': 0,
|
||||||
|
' пр': 1,
|
||||||
|
'то ': 2,
|
||||||
|
' не': 3,
|
||||||
|
'ли ': 4,
|
||||||
|
' по': 5,
|
||||||
|
'но ': 6,
|
||||||
|
' в ': 7,
|
||||||
|
'на ': 8,
|
||||||
|
'ть ': 9,
|
||||||
|
'не ': 10,
|
||||||
|
' и ': 11,
|
||||||
|
' ко': 12,
|
||||||
|
'ом ': 13,
|
||||||
|
'про': 14,
|
||||||
|
' то': 15,
|
||||||
|
'их ': 16,
|
||||||
|
' ка': 17,
|
||||||
|
'ать': 18,
|
||||||
|
'ото': 19,
|
||||||
|
' за': 20,
|
||||||
|
'ие ': 21,
|
||||||
|
'ова': 22,
|
||||||
|
'тел': 23,
|
||||||
|
'тор': 24,
|
||||||
|
' де': 25,
|
||||||
|
'ой ': 26,
|
||||||
|
'сти': 27,
|
||||||
|
' от': 28,
|
||||||
|
'ах ': 29,
|
||||||
|
'ми ': 30,
|
||||||
|
'стр': 31,
|
||||||
|
' бе': 32,
|
||||||
|
' во': 33,
|
||||||
|
' ра': 34,
|
||||||
|
'ая ': 35,
|
||||||
|
'ват': 36,
|
||||||
|
'ей ': 37,
|
||||||
|
'ет ': 38,
|
||||||
|
'же ': 39,
|
||||||
|
'иче': 40,
|
||||||
|
'ия ': 41,
|
||||||
|
'ов ': 42,
|
||||||
|
'сто': 43,
|
||||||
|
' об': 44,
|
||||||
|
'вер': 45,
|
||||||
|
'го ': 46,
|
||||||
|
'и в': 47,
|
||||||
|
'и п': 48,
|
||||||
|
'и с': 49,
|
||||||
|
'ии ': 50,
|
||||||
|
'ист': 51,
|
||||||
|
'о в': 52,
|
||||||
|
'ост': 53,
|
||||||
|
'тра': 54,
|
||||||
|
' те': 55,
|
||||||
|
'ели': 56,
|
||||||
|
'ере': 57,
|
||||||
|
'кот': 58,
|
||||||
|
'льн': 59,
|
||||||
|
'ник': 60,
|
||||||
|
'нти': 61,
|
||||||
|
'о с': 62,
|
||||||
|
'рор': 63,
|
||||||
|
'ств': 64,
|
||||||
|
'чес': 65,
|
||||||
|
' бо': 66,
|
||||||
|
' ве': 67,
|
||||||
|
' да': 68,
|
||||||
|
' ин': 69,
|
||||||
|
' но': 70,
|
||||||
|
' с ': 71,
|
||||||
|
' со': 72,
|
||||||
|
' сп': 73,
|
||||||
|
' ст': 74,
|
||||||
|
' чт': 75,
|
||||||
|
'али': 76,
|
||||||
|
'ами': 77,
|
||||||
|
'вид': 78,
|
||||||
|
'дет': 79,
|
||||||
|
'е н': 80,
|
||||||
|
'ель': 81,
|
||||||
|
'еск': 82,
|
||||||
|
'ест': 83,
|
||||||
|
'зал': 84,
|
||||||
|
'и н': 85,
|
||||||
|
'ива': 86,
|
||||||
|
'кон': 87,
|
||||||
|
'ого': 88,
|
||||||
|
'одн': 89,
|
||||||
|
'ожн': 90,
|
||||||
|
'оль': 91,
|
||||||
|
'ори': 92,
|
||||||
|
'ров': 93,
|
||||||
|
'ско': 94,
|
||||||
|
'ся ': 95,
|
||||||
|
'тер': 96,
|
||||||
|
'что': 97,
|
||||||
|
' мо': 98,
|
||||||
|
' са': 99,
|
||||||
|
' эт': 100,
|
||||||
|
'ант': 101,
|
||||||
|
'все': 102,
|
||||||
|
'ерр': 103,
|
||||||
|
'есл': 104,
|
||||||
|
'иде': 105,
|
||||||
|
'ина': 106,
|
||||||
|
'ино': 107,
|
||||||
|
'иро': 108,
|
||||||
|
'ите': 109,
|
||||||
|
'ка ': 110,
|
||||||
|
'ко ': 111,
|
||||||
|
'кол': 112,
|
||||||
|
'ком': 113,
|
||||||
|
'ла ': 114,
|
||||||
|
'ния': 115,
|
||||||
|
'о т': 116,
|
||||||
|
'оло': 117,
|
||||||
|
'ран': 118,
|
||||||
|
'ред': 119,
|
||||||
|
'сь ': 120,
|
||||||
|
'тив': 121,
|
||||||
|
'тич': 122,
|
||||||
|
'ых ': 123,
|
||||||
|
' ви': 124,
|
||||||
|
' вс': 125,
|
||||||
|
' го': 126,
|
||||||
|
' ма': 127,
|
||||||
|
' сл': 128,
|
||||||
|
'ако': 129,
|
||||||
|
'ани': 130,
|
||||||
|
'аст': 131,
|
||||||
|
'без': 132,
|
||||||
|
'дел': 133,
|
||||||
|
'е д': 134,
|
||||||
|
'е п': 135,
|
||||||
|
'ем ': 136,
|
||||||
|
'жно': 137,
|
||||||
|
'и д': 138,
|
||||||
|
'ика': 139,
|
||||||
|
'каз': 140,
|
||||||
|
'как': 141,
|
||||||
|
'ки ': 142,
|
||||||
|
'нос': 143,
|
||||||
|
'о н': 144,
|
||||||
|
'опа': 145,
|
||||||
|
'при': 146,
|
||||||
|
'рро': 147,
|
||||||
|
'ски': 148,
|
||||||
|
'ти ': 149,
|
||||||
|
'тов': 150,
|
||||||
|
'ые ': 151,
|
||||||
|
' вы': 152,
|
||||||
|
' до': 153,
|
||||||
|
' ме': 154,
|
||||||
|
' ни': 155,
|
||||||
|
' од': 156,
|
||||||
|
' ро': 157,
|
||||||
|
' св': 158,
|
||||||
|
' чи': 159,
|
||||||
|
'а н': 160,
|
||||||
|
'ает': 161,
|
||||||
|
'аза': 162,
|
||||||
|
'ате': 163,
|
||||||
|
'бес': 164,
|
||||||
|
'в п': 165,
|
||||||
|
'ва ': 166,
|
||||||
|
'е в': 167,
|
||||||
|
'е м': 168,
|
||||||
|
'е с': 169,
|
||||||
|
'ез ': 170,
|
||||||
|
'ени': 171,
|
||||||
|
'за ': 172,
|
||||||
|
'зна': 173,
|
||||||
|
'ини': 174,
|
||||||
|
'кам': 175,
|
||||||
|
'ках': 176,
|
||||||
|
'кто': 177,
|
||||||
|
'лов': 178,
|
||||||
|
'мер': 179,
|
||||||
|
'мож': 180,
|
||||||
|
'нал': 181,
|
||||||
|
'ниц': 182,
|
||||||
|
'ны ': 183,
|
||||||
|
'ным': 184,
|
||||||
|
'ора': 185,
|
||||||
|
'оро': 186,
|
||||||
|
'от ': 187,
|
||||||
|
'пор': 188,
|
||||||
|
'рав': 189,
|
||||||
|
'рес': 190,
|
||||||
|
'рис': 191,
|
||||||
|
'рос': 192,
|
||||||
|
'ска': 193,
|
||||||
|
'т н': 194,
|
||||||
|
'том': 195,
|
||||||
|
'чит': 196,
|
||||||
|
'шко': 197,
|
||||||
|
' бы': 198,
|
||||||
|
' о ': 199,
|
||||||
|
' тр': 200,
|
||||||
|
' уж': 201,
|
||||||
|
' чу': 202,
|
||||||
|
' шк': 203,
|
||||||
|
'а б': 204,
|
||||||
|
'а в': 205,
|
||||||
|
'а р': 206,
|
||||||
|
'аби': 207,
|
||||||
|
'ала': 208,
|
||||||
|
'ало': 209,
|
||||||
|
'аль': 210,
|
||||||
|
'анн': 211,
|
||||||
|
'ати': 212,
|
||||||
|
'бин': 213,
|
||||||
|
'вес': 214,
|
||||||
|
'вно': 215,
|
||||||
|
'во ': 216,
|
||||||
|
'вши': 217,
|
||||||
|
'дал': 218,
|
||||||
|
'дат': 219,
|
||||||
|
'дно': 220,
|
||||||
|
'е з': 221,
|
||||||
|
'его': 222,
|
||||||
|
'еле': 223,
|
||||||
|
'енн': 224,
|
||||||
|
'ент': 225,
|
||||||
|
'ете': 226,
|
||||||
|
'и о': 227,
|
||||||
|
'или': 228,
|
||||||
|
'ись': 229,
|
||||||
|
'ит ': 230,
|
||||||
|
'ици': 231,
|
||||||
|
'ков': 232,
|
||||||
|
'лен': 233,
|
||||||
|
'льк': 234,
|
||||||
|
'мен': 235,
|
||||||
|
'мы ': 236,
|
||||||
|
'нет': 237,
|
||||||
|
'ни ': 238,
|
||||||
|
'нны': 239,
|
||||||
|
'ног': 240,
|
||||||
|
'ной': 241,
|
||||||
|
'ном': 242,
|
||||||
|
'о п': 243,
|
||||||
|
'обн': 244,
|
||||||
|
'ове': 245,
|
||||||
|
'овн': 246,
|
||||||
|
'оры': 247,
|
||||||
|
'пер': 248,
|
||||||
|
'по ': 249,
|
||||||
|
'пра': 250,
|
||||||
|
'пре': 251,
|
||||||
|
'раз': 252,
|
||||||
|
'роп': 253,
|
||||||
|
'ры ': 254,
|
||||||
|
'се ': 255,
|
||||||
|
'сли': 256,
|
||||||
|
'сов': 257,
|
||||||
|
'тре': 258,
|
||||||
|
'тся': 259,
|
||||||
|
'уро': 260,
|
||||||
|
'цел': 261,
|
||||||
|
'чно': 262,
|
||||||
|
'ь в': 263,
|
||||||
|
'ько': 264,
|
||||||
|
'ьно': 265,
|
||||||
|
'это': 266,
|
||||||
|
'ют ': 267,
|
||||||
|
'я н': 268,
|
||||||
|
' ан': 269,
|
||||||
|
' ес': 270,
|
||||||
|
' же': 271,
|
||||||
|
' из': 272,
|
||||||
|
' кт': 273,
|
||||||
|
' ми': 274,
|
||||||
|
' мы': 275,
|
||||||
|
' пе': 276,
|
||||||
|
' се': 277,
|
||||||
|
' це': 278,
|
||||||
|
'а м': 279,
|
||||||
|
'а п': 280,
|
||||||
|
'а т': 281,
|
||||||
|
'авш': 282,
|
||||||
|
'аже': 283,
|
||||||
|
'ак ': 284,
|
||||||
|
'ал ': 285,
|
||||||
|
'але': 286,
|
||||||
|
'ане': 287,
|
||||||
|
'ачи': 288,
|
||||||
|
'ают': 289,
|
||||||
|
'бна': 290,
|
||||||
|
'бол': 291,
|
||||||
|
'бы ': 292,
|
||||||
|
'в и': 293,
|
||||||
|
'в с': 294,
|
||||||
|
'ван': 295,
|
||||||
|
'гра': 296,
|
||||||
|
'даж': 297,
|
||||||
|
'ден': 298,
|
||||||
|
'е к': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/sk.py
Normal file
303
libs/guess_language/data/models/sk.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
' pr': 0,
|
||||||
|
' po': 1,
|
||||||
|
' ne': 2,
|
||||||
|
' a ': 3,
|
||||||
|
'ch ': 4,
|
||||||
|
' na': 5,
|
||||||
|
' je': 6,
|
||||||
|
'ní ': 7,
|
||||||
|
'je ': 8,
|
||||||
|
' do': 9,
|
||||||
|
'na ': 10,
|
||||||
|
'ova': 11,
|
||||||
|
' v ': 12,
|
||||||
|
'to ': 13,
|
||||||
|
'ho ': 14,
|
||||||
|
'ou ': 15,
|
||||||
|
' to': 16,
|
||||||
|
'ick': 17,
|
||||||
|
'ter': 18,
|
||||||
|
'že ': 19,
|
||||||
|
' st': 20,
|
||||||
|
' za': 21,
|
||||||
|
'ost': 22,
|
||||||
|
'ých': 23,
|
||||||
|
' se': 24,
|
||||||
|
'pro': 25,
|
||||||
|
' te': 26,
|
||||||
|
'e s': 27,
|
||||||
|
' že': 28,
|
||||||
|
'a p': 29,
|
||||||
|
' kt': 30,
|
||||||
|
'pre': 31,
|
||||||
|
' by': 32,
|
||||||
|
' o ': 33,
|
||||||
|
'se ': 34,
|
||||||
|
'kon': 35,
|
||||||
|
' př': 36,
|
||||||
|
'a s': 37,
|
||||||
|
'né ': 38,
|
||||||
|
'ně ': 39,
|
||||||
|
'sti': 40,
|
||||||
|
'ako': 41,
|
||||||
|
'ist': 42,
|
||||||
|
'mu ': 43,
|
||||||
|
'ame': 44,
|
||||||
|
'ent': 45,
|
||||||
|
'ky ': 46,
|
||||||
|
'la ': 47,
|
||||||
|
'pod': 48,
|
||||||
|
' ve': 49,
|
||||||
|
' ob': 50,
|
||||||
|
'om ': 51,
|
||||||
|
'vat': 52,
|
||||||
|
' ko': 53,
|
||||||
|
'sta': 54,
|
||||||
|
'em ': 55,
|
||||||
|
'le ': 56,
|
||||||
|
'a v': 57,
|
||||||
|
'by ': 58,
|
||||||
|
'e p': 59,
|
||||||
|
'ko ': 60,
|
||||||
|
'eri': 61,
|
||||||
|
'kte': 62,
|
||||||
|
'sa ': 63,
|
||||||
|
'ého': 64,
|
||||||
|
'e v': 65,
|
||||||
|
'mer': 66,
|
||||||
|
'tel': 67,
|
||||||
|
' ak': 68,
|
||||||
|
' sv': 69,
|
||||||
|
' zá': 70,
|
||||||
|
'hla': 71,
|
||||||
|
'las': 72,
|
||||||
|
'lo ': 73,
|
||||||
|
' ta': 74,
|
||||||
|
'a n': 75,
|
||||||
|
'ej ': 76,
|
||||||
|
'li ': 77,
|
||||||
|
'ne ': 78,
|
||||||
|
' sa': 79,
|
||||||
|
'ak ': 80,
|
||||||
|
'ani': 81,
|
||||||
|
'ate': 82,
|
||||||
|
'ia ': 83,
|
||||||
|
'sou': 84,
|
||||||
|
' so': 85,
|
||||||
|
'ení': 86,
|
||||||
|
'ie ': 87,
|
||||||
|
' re': 88,
|
||||||
|
'ce ': 89,
|
||||||
|
'e n': 90,
|
||||||
|
'ori': 91,
|
||||||
|
'tic': 92,
|
||||||
|
' vy': 93,
|
||||||
|
'a t': 94,
|
||||||
|
'ké ': 95,
|
||||||
|
'nos': 96,
|
||||||
|
'o s': 97,
|
||||||
|
'str': 98,
|
||||||
|
'ti ': 99,
|
||||||
|
'uje': 100,
|
||||||
|
' sp': 101,
|
||||||
|
'lov': 102,
|
||||||
|
'o p': 103,
|
||||||
|
'oli': 104,
|
||||||
|
'ová': 105,
|
||||||
|
' ná': 106,
|
||||||
|
'ale': 107,
|
||||||
|
'den': 108,
|
||||||
|
'e o': 109,
|
||||||
|
'ku ': 110,
|
||||||
|
'val': 111,
|
||||||
|
' am': 112,
|
||||||
|
' ro': 113,
|
||||||
|
' si': 114,
|
||||||
|
'nie': 115,
|
||||||
|
'pol': 116,
|
||||||
|
'tra': 117,
|
||||||
|
' al': 118,
|
||||||
|
'ali': 119,
|
||||||
|
'o v': 120,
|
||||||
|
'tor': 121,
|
||||||
|
' mo': 122,
|
||||||
|
' ni': 123,
|
||||||
|
'ci ': 124,
|
||||||
|
'o n': 125,
|
||||||
|
'ím ': 126,
|
||||||
|
' le': 127,
|
||||||
|
' pa': 128,
|
||||||
|
' s ': 129,
|
||||||
|
'al ': 130,
|
||||||
|
'ati': 131,
|
||||||
|
'ero': 132,
|
||||||
|
'ove': 133,
|
||||||
|
'rov': 134,
|
||||||
|
'ván': 135,
|
||||||
|
'ích': 136,
|
||||||
|
' ja': 137,
|
||||||
|
' z ': 138,
|
||||||
|
'cké': 139,
|
||||||
|
'e z': 140,
|
||||||
|
' od': 141,
|
||||||
|
'byl': 142,
|
||||||
|
'de ': 143,
|
||||||
|
'dob': 144,
|
||||||
|
'nep': 145,
|
||||||
|
'pra': 146,
|
||||||
|
'ric': 147,
|
||||||
|
'spo': 148,
|
||||||
|
'tak': 149,
|
||||||
|
' vš': 150,
|
||||||
|
'a a': 151,
|
||||||
|
'e t': 152,
|
||||||
|
'lit': 153,
|
||||||
|
'me ': 154,
|
||||||
|
'nej': 155,
|
||||||
|
'no ': 156,
|
||||||
|
'nýc': 157,
|
||||||
|
'o t': 158,
|
||||||
|
'a j': 159,
|
||||||
|
'e a': 160,
|
||||||
|
'en ': 161,
|
||||||
|
'est': 162,
|
||||||
|
'jí ': 163,
|
||||||
|
'mi ': 164,
|
||||||
|
'slo': 165,
|
||||||
|
'stá': 166,
|
||||||
|
'u v': 167,
|
||||||
|
'for': 168,
|
||||||
|
'nou': 169,
|
||||||
|
'pos': 170,
|
||||||
|
'pře': 171,
|
||||||
|
'si ': 172,
|
||||||
|
'tom': 173,
|
||||||
|
' vl': 174,
|
||||||
|
'a z': 175,
|
||||||
|
'ly ': 176,
|
||||||
|
'orm': 177,
|
||||||
|
'ris': 178,
|
||||||
|
'za ': 179,
|
||||||
|
'zák': 180,
|
||||||
|
' k ': 181,
|
||||||
|
'at ': 182,
|
||||||
|
'cký': 183,
|
||||||
|
'dno': 184,
|
||||||
|
'dos': 185,
|
||||||
|
'dy ': 186,
|
||||||
|
'jak': 187,
|
||||||
|
'kov': 188,
|
||||||
|
'ny ': 189,
|
||||||
|
'res': 190,
|
||||||
|
'ror': 191,
|
||||||
|
'sto': 192,
|
||||||
|
'van': 193,
|
||||||
|
' op': 194,
|
||||||
|
'da ': 195,
|
||||||
|
'do ': 196,
|
||||||
|
'e j': 197,
|
||||||
|
'hod': 198,
|
||||||
|
'len': 199,
|
||||||
|
'ný ': 200,
|
||||||
|
'o z': 201,
|
||||||
|
'poz': 202,
|
||||||
|
'pri': 203,
|
||||||
|
'ran': 204,
|
||||||
|
'u s': 205,
|
||||||
|
' ab': 206,
|
||||||
|
'aj ': 207,
|
||||||
|
'ast': 208,
|
||||||
|
'it ': 209,
|
||||||
|
'kto': 210,
|
||||||
|
'o o': 211,
|
||||||
|
'oby': 212,
|
||||||
|
'odo': 213,
|
||||||
|
'u p': 214,
|
||||||
|
'va ': 215,
|
||||||
|
'ání': 216,
|
||||||
|
'í p': 217,
|
||||||
|
'ým ': 218,
|
||||||
|
' in': 219,
|
||||||
|
' mi': 220,
|
||||||
|
'ať ': 221,
|
||||||
|
'dov': 222,
|
||||||
|
'ka ': 223,
|
||||||
|
'nsk': 224,
|
||||||
|
'áln': 225,
|
||||||
|
' an': 226,
|
||||||
|
' bu': 227,
|
||||||
|
' sl': 228,
|
||||||
|
' tr': 229,
|
||||||
|
'e m': 230,
|
||||||
|
'ech': 231,
|
||||||
|
'edn': 232,
|
||||||
|
'i n': 233,
|
||||||
|
'kýc': 234,
|
||||||
|
'níc': 235,
|
||||||
|
'ov ': 236,
|
||||||
|
'pří': 237,
|
||||||
|
'í a': 238,
|
||||||
|
' aj': 239,
|
||||||
|
' bo': 240,
|
||||||
|
'a d': 241,
|
||||||
|
'ide': 242,
|
||||||
|
'o a': 243,
|
||||||
|
'o d': 244,
|
||||||
|
'och': 245,
|
||||||
|
'pov': 246,
|
||||||
|
'svo': 247,
|
||||||
|
'é s': 248,
|
||||||
|
' kd': 249,
|
||||||
|
' vo': 250,
|
||||||
|
' vý': 251,
|
||||||
|
'bud': 252,
|
||||||
|
'ich': 253,
|
||||||
|
'il ': 254,
|
||||||
|
'ili': 255,
|
||||||
|
'ni ': 256,
|
||||||
|
'ním': 257,
|
||||||
|
'od ': 258,
|
||||||
|
'osl': 259,
|
||||||
|
'ouh': 260,
|
||||||
|
'rav': 261,
|
||||||
|
'roz': 262,
|
||||||
|
'st ': 263,
|
||||||
|
'stv': 264,
|
||||||
|
'tu ': 265,
|
||||||
|
'u a': 266,
|
||||||
|
'vál': 267,
|
||||||
|
'y s': 268,
|
||||||
|
'í s': 269,
|
||||||
|
'í v': 270,
|
||||||
|
' hl': 271,
|
||||||
|
' li': 272,
|
||||||
|
' me': 273,
|
||||||
|
'a m': 274,
|
||||||
|
'e b': 275,
|
||||||
|
'h s': 276,
|
||||||
|
'i p': 277,
|
||||||
|
'i s': 278,
|
||||||
|
'iti': 279,
|
||||||
|
'lád': 280,
|
||||||
|
'nem': 281,
|
||||||
|
'nov': 282,
|
||||||
|
'opo': 283,
|
||||||
|
'uhl': 284,
|
||||||
|
'eno': 285,
|
||||||
|
'ens': 286,
|
||||||
|
'men': 287,
|
||||||
|
'nes': 288,
|
||||||
|
'obo': 289,
|
||||||
|
'te ': 290,
|
||||||
|
'ved': 291,
|
||||||
|
'vlá': 292,
|
||||||
|
'y n': 293,
|
||||||
|
' ma': 294,
|
||||||
|
' mu': 295,
|
||||||
|
' vá': 296,
|
||||||
|
'bez': 297,
|
||||||
|
'byv': 298,
|
||||||
|
'cho': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/sl.py
Normal file
303
libs/guess_language/data/models/sl.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'je ': 0,
|
||||||
|
' pr': 1,
|
||||||
|
' po': 2,
|
||||||
|
' je': 3,
|
||||||
|
' v ': 4,
|
||||||
|
' za': 5,
|
||||||
|
' na': 6,
|
||||||
|
'pre': 7,
|
||||||
|
'da ': 8,
|
||||||
|
' da': 9,
|
||||||
|
'ki ': 10,
|
||||||
|
'ti ': 11,
|
||||||
|
'ja ': 12,
|
||||||
|
'ne ': 13,
|
||||||
|
' in': 14,
|
||||||
|
'in ': 15,
|
||||||
|
'li ': 16,
|
||||||
|
'no ': 17,
|
||||||
|
'na ': 18,
|
||||||
|
'ni ': 19,
|
||||||
|
' bi': 20,
|
||||||
|
'jo ': 21,
|
||||||
|
' ne': 22,
|
||||||
|
'nje': 23,
|
||||||
|
'e p': 24,
|
||||||
|
'i p': 25,
|
||||||
|
'pri': 26,
|
||||||
|
'o p': 27,
|
||||||
|
'red': 28,
|
||||||
|
' do': 29,
|
||||||
|
'anj': 30,
|
||||||
|
'em ': 31,
|
||||||
|
'ih ': 32,
|
||||||
|
' bo': 33,
|
||||||
|
' ki': 34,
|
||||||
|
' iz': 35,
|
||||||
|
' se': 36,
|
||||||
|
' so': 37,
|
||||||
|
'al ': 38,
|
||||||
|
' de': 39,
|
||||||
|
'e v': 40,
|
||||||
|
'i s': 41,
|
||||||
|
'ko ': 42,
|
||||||
|
'bil': 43,
|
||||||
|
'ira': 44,
|
||||||
|
'ove': 45,
|
||||||
|
' br': 46,
|
||||||
|
' ob': 47,
|
||||||
|
'e b': 48,
|
||||||
|
'i n': 49,
|
||||||
|
'ova': 50,
|
||||||
|
'se ': 51,
|
||||||
|
'za ': 52,
|
||||||
|
'la ': 53,
|
||||||
|
' ja': 54,
|
||||||
|
'ati': 55,
|
||||||
|
'so ': 56,
|
||||||
|
'ter': 57,
|
||||||
|
' ta': 58,
|
||||||
|
'a s': 59,
|
||||||
|
'del': 60,
|
||||||
|
'e d': 61,
|
||||||
|
' dr': 62,
|
||||||
|
' od': 63,
|
||||||
|
'a n': 64,
|
||||||
|
'ar ': 65,
|
||||||
|
'jal': 66,
|
||||||
|
'ji ': 67,
|
||||||
|
'rit': 68,
|
||||||
|
' ka': 69,
|
||||||
|
' ko': 70,
|
||||||
|
' pa': 71,
|
||||||
|
'a b': 72,
|
||||||
|
'ani': 73,
|
||||||
|
'e s': 74,
|
||||||
|
'er ': 75,
|
||||||
|
'ili': 76,
|
||||||
|
'lov': 77,
|
||||||
|
'o v': 78,
|
||||||
|
'tov': 79,
|
||||||
|
' ir': 80,
|
||||||
|
' ni': 81,
|
||||||
|
' vo': 82,
|
||||||
|
'a j': 83,
|
||||||
|
'bi ': 84,
|
||||||
|
'bri': 85,
|
||||||
|
'iti': 86,
|
||||||
|
'let': 87,
|
||||||
|
'o n': 88,
|
||||||
|
'tan': 89,
|
||||||
|
'še ': 90,
|
||||||
|
' le': 91,
|
||||||
|
' te': 92,
|
||||||
|
'eni': 93,
|
||||||
|
'eri': 94,
|
||||||
|
'ita': 95,
|
||||||
|
'kat': 96,
|
||||||
|
'por': 97,
|
||||||
|
'pro': 98,
|
||||||
|
'ali': 99,
|
||||||
|
'ke ': 100,
|
||||||
|
'oli': 101,
|
||||||
|
'ov ': 102,
|
||||||
|
'pra': 103,
|
||||||
|
'ri ': 104,
|
||||||
|
'uar': 105,
|
||||||
|
've ': 106,
|
||||||
|
' to': 107,
|
||||||
|
'a i': 108,
|
||||||
|
'a v': 109,
|
||||||
|
'ako': 110,
|
||||||
|
'arj': 111,
|
||||||
|
'ate': 112,
|
||||||
|
'di ': 113,
|
||||||
|
'do ': 114,
|
||||||
|
'ga ': 115,
|
||||||
|
'le ': 116,
|
||||||
|
'lo ': 117,
|
||||||
|
'mer': 118,
|
||||||
|
'o s': 119,
|
||||||
|
'oda': 120,
|
||||||
|
'oro': 121,
|
||||||
|
'pod': 122,
|
||||||
|
' ma': 123,
|
||||||
|
' mo': 124,
|
||||||
|
' si': 125,
|
||||||
|
'a p': 126,
|
||||||
|
'bod': 127,
|
||||||
|
'e n': 128,
|
||||||
|
'ega': 129,
|
||||||
|
'ju ': 130,
|
||||||
|
'ka ': 131,
|
||||||
|
'lje': 132,
|
||||||
|
'rav': 133,
|
||||||
|
'ta ': 134,
|
||||||
|
'a o': 135,
|
||||||
|
'e t': 136,
|
||||||
|
'e z': 137,
|
||||||
|
'i d': 138,
|
||||||
|
'i v': 139,
|
||||||
|
'ila': 140,
|
||||||
|
'lit': 141,
|
||||||
|
'nih': 142,
|
||||||
|
'odo': 143,
|
||||||
|
'sti': 144,
|
||||||
|
'to ': 145,
|
||||||
|
'var': 146,
|
||||||
|
'ved': 147,
|
||||||
|
'vol': 148,
|
||||||
|
' la': 149,
|
||||||
|
' no': 150,
|
||||||
|
' vs': 151,
|
||||||
|
'a d': 152,
|
||||||
|
'agu': 153,
|
||||||
|
'aja': 154,
|
||||||
|
'dej': 155,
|
||||||
|
'dnj': 156,
|
||||||
|
'eda': 157,
|
||||||
|
'gov': 158,
|
||||||
|
'gua': 159,
|
||||||
|
'jag': 160,
|
||||||
|
'jem': 161,
|
||||||
|
'kon': 162,
|
||||||
|
'ku ': 163,
|
||||||
|
'nij': 164,
|
||||||
|
'omo': 165,
|
||||||
|
'oči': 166,
|
||||||
|
'pov': 167,
|
||||||
|
'rak': 168,
|
||||||
|
'rja': 169,
|
||||||
|
'sta': 170,
|
||||||
|
'tev': 171,
|
||||||
|
'a t': 172,
|
||||||
|
'aj ': 173,
|
||||||
|
'ed ': 174,
|
||||||
|
'eja': 175,
|
||||||
|
'ent': 176,
|
||||||
|
'ev ': 177,
|
||||||
|
'i i': 178,
|
||||||
|
'i o': 179,
|
||||||
|
'ijo': 180,
|
||||||
|
'ist': 181,
|
||||||
|
'ost': 182,
|
||||||
|
'ske': 183,
|
||||||
|
'str': 184,
|
||||||
|
' ra': 185,
|
||||||
|
' s ': 186,
|
||||||
|
' tr': 187,
|
||||||
|
' še': 188,
|
||||||
|
'arn': 189,
|
||||||
|
'bo ': 190,
|
||||||
|
'drž': 191,
|
||||||
|
'i j': 192,
|
||||||
|
'ilo': 193,
|
||||||
|
'izv': 194,
|
||||||
|
'jen': 195,
|
||||||
|
'lja': 196,
|
||||||
|
'nsk': 197,
|
||||||
|
'o d': 198,
|
||||||
|
'o i': 199,
|
||||||
|
'om ': 200,
|
||||||
|
'ora': 201,
|
||||||
|
'ovo': 202,
|
||||||
|
'raz': 203,
|
||||||
|
'rža': 204,
|
||||||
|
'tak': 205,
|
||||||
|
'va ': 206,
|
||||||
|
'ven': 207,
|
||||||
|
'žav': 208,
|
||||||
|
' me': 209,
|
||||||
|
' če': 210,
|
||||||
|
'ame': 211,
|
||||||
|
'avi': 212,
|
||||||
|
'e i': 213,
|
||||||
|
'e o': 214,
|
||||||
|
'eka': 215,
|
||||||
|
'gre': 216,
|
||||||
|
'i t': 217,
|
||||||
|
'ija': 218,
|
||||||
|
'il ': 219,
|
||||||
|
'ite': 220,
|
||||||
|
'kra': 221,
|
||||||
|
'lju': 222,
|
||||||
|
'mor': 223,
|
||||||
|
'nik': 224,
|
||||||
|
'o t': 225,
|
||||||
|
'obi': 226,
|
||||||
|
'odn': 227,
|
||||||
|
'ran': 228,
|
||||||
|
're ': 229,
|
||||||
|
'sto': 230,
|
||||||
|
'stv': 231,
|
||||||
|
'udi': 232,
|
||||||
|
'v i': 233,
|
||||||
|
'van': 234,
|
||||||
|
' am': 235,
|
||||||
|
' sp': 236,
|
||||||
|
' st': 237,
|
||||||
|
' tu': 238,
|
||||||
|
' ve': 239,
|
||||||
|
' že': 240,
|
||||||
|
'ajo': 241,
|
||||||
|
'ale': 242,
|
||||||
|
'apo': 243,
|
||||||
|
'dal': 244,
|
||||||
|
'dru': 245,
|
||||||
|
'e j': 246,
|
||||||
|
'edn': 247,
|
||||||
|
'ejo': 248,
|
||||||
|
'elo': 249,
|
||||||
|
'est': 250,
|
||||||
|
'etj': 251,
|
||||||
|
'eva': 252,
|
||||||
|
'iji': 253,
|
||||||
|
'ik ': 254,
|
||||||
|
'im ': 255,
|
||||||
|
'itv': 256,
|
||||||
|
'mob': 257,
|
||||||
|
'nap': 258,
|
||||||
|
'nek': 259,
|
||||||
|
'pol': 260,
|
||||||
|
'pos': 261,
|
||||||
|
'rat': 262,
|
||||||
|
'ski': 263,
|
||||||
|
'tič': 264,
|
||||||
|
'tom': 265,
|
||||||
|
'ton': 266,
|
||||||
|
'tra': 267,
|
||||||
|
'tud': 268,
|
||||||
|
'tve': 269,
|
||||||
|
'v b': 270,
|
||||||
|
'vil': 271,
|
||||||
|
'vse': 272,
|
||||||
|
'čit': 273,
|
||||||
|
' av': 274,
|
||||||
|
' gr': 275,
|
||||||
|
'a z': 276,
|
||||||
|
'ans': 277,
|
||||||
|
'ast': 278,
|
||||||
|
'avt': 279,
|
||||||
|
'dan': 280,
|
||||||
|
'e m': 281,
|
||||||
|
'eds': 282,
|
||||||
|
'for': 283,
|
||||||
|
'i z': 284,
|
||||||
|
'kot': 285,
|
||||||
|
'mi ': 286,
|
||||||
|
'nim': 287,
|
||||||
|
'o b': 288,
|
||||||
|
'o o': 289,
|
||||||
|
'od ': 290,
|
||||||
|
'odl': 291,
|
||||||
|
'oiz': 292,
|
||||||
|
'ot ': 293,
|
||||||
|
'par': 294,
|
||||||
|
'pot': 295,
|
||||||
|
'rje': 296,
|
||||||
|
'roi': 297,
|
||||||
|
'tem': 298,
|
||||||
|
'val': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/so.py
Normal file
303
libs/guess_language/data/models/so.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'ka ': 0,
|
||||||
|
'ay ': 1,
|
||||||
|
'da ': 2,
|
||||||
|
' ay': 3,
|
||||||
|
'aal': 4,
|
||||||
|
'oo ': 5,
|
||||||
|
'aan': 6,
|
||||||
|
' ka': 7,
|
||||||
|
'an ': 8,
|
||||||
|
'in ': 9,
|
||||||
|
' in': 10,
|
||||||
|
'ada': 11,
|
||||||
|
'maa': 12,
|
||||||
|
'aba': 13,
|
||||||
|
' so': 14,
|
||||||
|
'ali': 15,
|
||||||
|
'bad': 16,
|
||||||
|
'add': 17,
|
||||||
|
'soo': 18,
|
||||||
|
' na': 19,
|
||||||
|
'aha': 20,
|
||||||
|
'ku ': 21,
|
||||||
|
'ta ': 22,
|
||||||
|
' wa': 23,
|
||||||
|
'yo ': 24,
|
||||||
|
'a s': 25,
|
||||||
|
'oma': 26,
|
||||||
|
'yaa': 27,
|
||||||
|
' ba': 28,
|
||||||
|
' ku': 29,
|
||||||
|
' la': 30,
|
||||||
|
' oo': 31,
|
||||||
|
'iya': 32,
|
||||||
|
'sha': 33,
|
||||||
|
'a a': 34,
|
||||||
|
'dda': 35,
|
||||||
|
'nab': 36,
|
||||||
|
'nta': 37,
|
||||||
|
' da': 38,
|
||||||
|
' ma': 39,
|
||||||
|
'nka': 40,
|
||||||
|
'uu ': 41,
|
||||||
|
'y i': 42,
|
||||||
|
'aya': 43,
|
||||||
|
'ha ': 44,
|
||||||
|
'raa': 45,
|
||||||
|
' dh': 46,
|
||||||
|
' qa': 47,
|
||||||
|
'a k': 48,
|
||||||
|
'ala': 49,
|
||||||
|
'baa': 50,
|
||||||
|
'doo': 51,
|
||||||
|
'had': 52,
|
||||||
|
'liy': 53,
|
||||||
|
'oom': 54,
|
||||||
|
' ha': 55,
|
||||||
|
' sh': 56,
|
||||||
|
'a d': 57,
|
||||||
|
'a i': 58,
|
||||||
|
'a n': 59,
|
||||||
|
'aar': 60,
|
||||||
|
'ee ': 61,
|
||||||
|
'ey ': 62,
|
||||||
|
'y k': 63,
|
||||||
|
'ya ': 64,
|
||||||
|
' ee': 65,
|
||||||
|
' iy': 66,
|
||||||
|
'aa ': 67,
|
||||||
|
'aaq': 68,
|
||||||
|
'gaa': 69,
|
||||||
|
'lam': 70,
|
||||||
|
' bu': 71,
|
||||||
|
'a b': 72,
|
||||||
|
'a m': 73,
|
||||||
|
'ad ': 74,
|
||||||
|
'aga': 75,
|
||||||
|
'ama': 76,
|
||||||
|
'iyo': 77,
|
||||||
|
'la ': 78,
|
||||||
|
'a c': 79,
|
||||||
|
'a l': 80,
|
||||||
|
'een': 81,
|
||||||
|
'int': 82,
|
||||||
|
'she': 83,
|
||||||
|
'wax': 84,
|
||||||
|
'yee': 85,
|
||||||
|
' si': 86,
|
||||||
|
' uu': 87,
|
||||||
|
'a h': 88,
|
||||||
|
'aas': 89,
|
||||||
|
'alk': 90,
|
||||||
|
'dha': 91,
|
||||||
|
'gu ': 92,
|
||||||
|
'hee': 93,
|
||||||
|
'ii ': 94,
|
||||||
|
'ira': 95,
|
||||||
|
'mad': 96,
|
||||||
|
'o a': 97,
|
||||||
|
'o k': 98,
|
||||||
|
'qay': 99,
|
||||||
|
' ah': 100,
|
||||||
|
' ca': 101,
|
||||||
|
' wu': 102,
|
||||||
|
'ank': 103,
|
||||||
|
'ash': 104,
|
||||||
|
'axa': 105,
|
||||||
|
'eed': 106,
|
||||||
|
'en ': 107,
|
||||||
|
'ga ': 108,
|
||||||
|
'haa': 109,
|
||||||
|
'n a': 110,
|
||||||
|
'n s': 111,
|
||||||
|
'naa': 112,
|
||||||
|
'nay': 113,
|
||||||
|
'o d': 114,
|
||||||
|
'taa': 115,
|
||||||
|
'u b': 116,
|
||||||
|
'uxu': 117,
|
||||||
|
'wux': 118,
|
||||||
|
'xuu': 119,
|
||||||
|
' ci': 120,
|
||||||
|
' do': 121,
|
||||||
|
' ho': 122,
|
||||||
|
' ta': 123,
|
||||||
|
'a g': 124,
|
||||||
|
'a u': 125,
|
||||||
|
'ana': 126,
|
||||||
|
'ayo': 127,
|
||||||
|
'dhi': 128,
|
||||||
|
'iin': 129,
|
||||||
|
'lag': 130,
|
||||||
|
'lin': 131,
|
||||||
|
'lka': 132,
|
||||||
|
'o i': 133,
|
||||||
|
'san': 134,
|
||||||
|
'u s': 135,
|
||||||
|
'una': 136,
|
||||||
|
'uun': 137,
|
||||||
|
' ga': 138,
|
||||||
|
' xa': 139,
|
||||||
|
' xu': 140,
|
||||||
|
'aab': 141,
|
||||||
|
'abt': 142,
|
||||||
|
'aq ': 143,
|
||||||
|
'aqa': 144,
|
||||||
|
'ara': 145,
|
||||||
|
'arl': 146,
|
||||||
|
'caa': 147,
|
||||||
|
'cir': 148,
|
||||||
|
'eeg': 149,
|
||||||
|
'eel': 150,
|
||||||
|
'isa': 151,
|
||||||
|
'kal': 152,
|
||||||
|
'lah': 153,
|
||||||
|
'ney': 154,
|
||||||
|
'qaa': 155,
|
||||||
|
'rla': 156,
|
||||||
|
'sad': 157,
|
||||||
|
'sii': 158,
|
||||||
|
'u d': 159,
|
||||||
|
'wad': 160,
|
||||||
|
' ad': 161,
|
||||||
|
' ar': 162,
|
||||||
|
' di': 163,
|
||||||
|
' jo': 164,
|
||||||
|
' ra': 165,
|
||||||
|
' sa': 166,
|
||||||
|
' u ': 167,
|
||||||
|
' yi': 168,
|
||||||
|
'a j': 169,
|
||||||
|
'a q': 170,
|
||||||
|
'aad': 171,
|
||||||
|
'aat': 172,
|
||||||
|
'aay': 173,
|
||||||
|
'ah ': 174,
|
||||||
|
'ale': 175,
|
||||||
|
'amk': 176,
|
||||||
|
'ari': 177,
|
||||||
|
'as ': 178,
|
||||||
|
'aye': 179,
|
||||||
|
'bus': 180,
|
||||||
|
'dal': 181,
|
||||||
|
'ddu': 182,
|
||||||
|
'dii': 183,
|
||||||
|
'du ': 184,
|
||||||
|
'duu': 185,
|
||||||
|
'ed ': 186,
|
||||||
|
'ege': 187,
|
||||||
|
'gey': 188,
|
||||||
|
'hay': 189,
|
||||||
|
'hii': 190,
|
||||||
|
'ida': 191,
|
||||||
|
'ine': 192,
|
||||||
|
'joo': 193,
|
||||||
|
'laa': 194,
|
||||||
|
'lay': 195,
|
||||||
|
'mar': 196,
|
||||||
|
'mee': 197,
|
||||||
|
'n b': 198,
|
||||||
|
'n d': 199,
|
||||||
|
'n m': 200,
|
||||||
|
'no ': 201,
|
||||||
|
'o b': 202,
|
||||||
|
'o l': 203,
|
||||||
|
'oog': 204,
|
||||||
|
'oon': 205,
|
||||||
|
'rga': 206,
|
||||||
|
'sh ': 207,
|
||||||
|
'sid': 208,
|
||||||
|
'u q': 209,
|
||||||
|
'unk': 210,
|
||||||
|
'ush': 211,
|
||||||
|
'xa ': 212,
|
||||||
|
'y d': 213,
|
||||||
|
' bi': 214,
|
||||||
|
' gu': 215,
|
||||||
|
' is': 216,
|
||||||
|
' ke': 217,
|
||||||
|
' lo': 218,
|
||||||
|
' me': 219,
|
||||||
|
' mu': 220,
|
||||||
|
' qo': 221,
|
||||||
|
' ug': 222,
|
||||||
|
'a e': 223,
|
||||||
|
'a o': 224,
|
||||||
|
'a w': 225,
|
||||||
|
'adi': 226,
|
||||||
|
'ado': 227,
|
||||||
|
'agu': 228,
|
||||||
|
'al ': 229,
|
||||||
|
'ant': 230,
|
||||||
|
'ark': 231,
|
||||||
|
'asa': 232,
|
||||||
|
'awi': 233,
|
||||||
|
'bta': 234,
|
||||||
|
'bul': 235,
|
||||||
|
'd a': 236,
|
||||||
|
'dag': 237,
|
||||||
|
'dan': 238,
|
||||||
|
'do ': 239,
|
||||||
|
'e s': 240,
|
||||||
|
'gal': 241,
|
||||||
|
'gay': 242,
|
||||||
|
'guu': 243,
|
||||||
|
'h e': 244,
|
||||||
|
'hal': 245,
|
||||||
|
'iga': 246,
|
||||||
|
'ihi': 247,
|
||||||
|
'iri': 248,
|
||||||
|
'iye': 249,
|
||||||
|
'ken': 250,
|
||||||
|
'lad': 251,
|
||||||
|
'lid': 252,
|
||||||
|
'lsh': 253,
|
||||||
|
'mag': 254,
|
||||||
|
'mun': 255,
|
||||||
|
'n h': 256,
|
||||||
|
'n i': 257,
|
||||||
|
'na ': 258,
|
||||||
|
'o n': 259,
|
||||||
|
'o w': 260,
|
||||||
|
'ood': 261,
|
||||||
|
'oor': 262,
|
||||||
|
'ora': 263,
|
||||||
|
'qab': 264,
|
||||||
|
'qor': 265,
|
||||||
|
'rab': 266,
|
||||||
|
'rit': 267,
|
||||||
|
'rta': 268,
|
||||||
|
's o': 269,
|
||||||
|
'sab': 270,
|
||||||
|
'ska': 271,
|
||||||
|
'to ': 272,
|
||||||
|
'u a': 273,
|
||||||
|
'u h': 274,
|
||||||
|
'u u': 275,
|
||||||
|
'ud ': 276,
|
||||||
|
'ugu': 277,
|
||||||
|
'uls': 278,
|
||||||
|
'uud': 279,
|
||||||
|
'waa': 280,
|
||||||
|
'xus': 281,
|
||||||
|
'y b': 282,
|
||||||
|
'y q': 283,
|
||||||
|
'y s': 284,
|
||||||
|
'yad': 285,
|
||||||
|
'yay': 286,
|
||||||
|
'yih': 287,
|
||||||
|
' aa': 288,
|
||||||
|
' bo': 289,
|
||||||
|
' br': 290,
|
||||||
|
' go': 291,
|
||||||
|
' ji': 292,
|
||||||
|
' mi': 293,
|
||||||
|
' of': 294,
|
||||||
|
' ti': 295,
|
||||||
|
' um': 296,
|
||||||
|
' wi': 297,
|
||||||
|
' xo': 298,
|
||||||
|
'a x': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/sq.py
Normal file
303
libs/guess_language/data/models/sq.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'të ': 0,
|
||||||
|
' të': 1,
|
||||||
|
'në ': 2,
|
||||||
|
'për': 3,
|
||||||
|
' pë': 4,
|
||||||
|
' e ': 5,
|
||||||
|
'sht': 6,
|
||||||
|
' në': 7,
|
||||||
|
' sh': 8,
|
||||||
|
'se ': 9,
|
||||||
|
'et ': 10,
|
||||||
|
'ë s': 11,
|
||||||
|
'ë t': 12,
|
||||||
|
' se': 13,
|
||||||
|
'he ': 14,
|
||||||
|
'jë ': 15,
|
||||||
|
'ër ': 16,
|
||||||
|
'dhe': 17,
|
||||||
|
' pa': 18,
|
||||||
|
'ë n': 19,
|
||||||
|
'ë p': 20,
|
||||||
|
' që': 21,
|
||||||
|
' dh': 22,
|
||||||
|
'një': 23,
|
||||||
|
'ë m': 24,
|
||||||
|
' nj': 25,
|
||||||
|
'ësh': 26,
|
||||||
|
'in ': 27,
|
||||||
|
' me': 28,
|
||||||
|
'që ': 29,
|
||||||
|
' po': 30,
|
||||||
|
'e n': 31,
|
||||||
|
'e t': 32,
|
||||||
|
'ish': 33,
|
||||||
|
'më ': 34,
|
||||||
|
'së ': 35,
|
||||||
|
'me ': 36,
|
||||||
|
'htë': 37,
|
||||||
|
' ka': 38,
|
||||||
|
' si': 39,
|
||||||
|
'e k': 40,
|
||||||
|
'e p': 41,
|
||||||
|
' i ': 42,
|
||||||
|
'anë': 43,
|
||||||
|
'ar ': 44,
|
||||||
|
' nu': 45,
|
||||||
|
'und': 46,
|
||||||
|
've ': 47,
|
||||||
|
' ës': 48,
|
||||||
|
'e s': 49,
|
||||||
|
' më': 50,
|
||||||
|
'nuk': 51,
|
||||||
|
'par': 52,
|
||||||
|
'uar': 53,
|
||||||
|
'uk ': 54,
|
||||||
|
'jo ': 55,
|
||||||
|
'rë ': 56,
|
||||||
|
'ta ': 57,
|
||||||
|
'ë f': 58,
|
||||||
|
'en ': 59,
|
||||||
|
'it ': 60,
|
||||||
|
'min': 61,
|
||||||
|
'het': 62,
|
||||||
|
'n e': 63,
|
||||||
|
'ri ': 64,
|
||||||
|
'shq': 65,
|
||||||
|
'ë d': 66,
|
||||||
|
' do': 67,
|
||||||
|
' nd': 68,
|
||||||
|
'sh ': 69,
|
||||||
|
'ën ': 70,
|
||||||
|
'atë': 71,
|
||||||
|
'hqi': 72,
|
||||||
|
'ist': 73,
|
||||||
|
'ë q': 74,
|
||||||
|
' gj': 75,
|
||||||
|
' ng': 76,
|
||||||
|
' th': 77,
|
||||||
|
'a n': 78,
|
||||||
|
'do ': 79,
|
||||||
|
'end': 80,
|
||||||
|
'imi': 81,
|
||||||
|
'ndi': 82,
|
||||||
|
'r t': 83,
|
||||||
|
'rat': 84,
|
||||||
|
'ë b': 85,
|
||||||
|
'ëri': 86,
|
||||||
|
' mu': 87,
|
||||||
|
'art': 88,
|
||||||
|
'ash': 89,
|
||||||
|
'qip': 90,
|
||||||
|
' ko': 91,
|
||||||
|
'e m': 92,
|
||||||
|
'edh': 93,
|
||||||
|
'eri': 94,
|
||||||
|
'je ': 95,
|
||||||
|
'ka ': 96,
|
||||||
|
'nga': 97,
|
||||||
|
'si ': 98,
|
||||||
|
'te ': 99,
|
||||||
|
'ë k': 100,
|
||||||
|
'ësi': 101,
|
||||||
|
' ma': 102,
|
||||||
|
' ti': 103,
|
||||||
|
'eve': 104,
|
||||||
|
'hje': 105,
|
||||||
|
'ira': 106,
|
||||||
|
'mun': 107,
|
||||||
|
'on ': 108,
|
||||||
|
'po ': 109,
|
||||||
|
're ': 110,
|
||||||
|
' pr': 111,
|
||||||
|
'im ': 112,
|
||||||
|
'lit': 113,
|
||||||
|
'o t': 114,
|
||||||
|
'ur ': 115,
|
||||||
|
'ë e': 116,
|
||||||
|
'ë v': 117,
|
||||||
|
'ët ': 118,
|
||||||
|
' ku': 119,
|
||||||
|
' së': 120,
|
||||||
|
'e d': 121,
|
||||||
|
'es ': 122,
|
||||||
|
'ga ': 123,
|
||||||
|
'iti': 124,
|
||||||
|
'jet': 125,
|
||||||
|
'ndë': 126,
|
||||||
|
'oli': 127,
|
||||||
|
'shi': 128,
|
||||||
|
'tje': 129,
|
||||||
|
' bë': 130,
|
||||||
|
' z ': 131,
|
||||||
|
'gje': 132,
|
||||||
|
'kan': 133,
|
||||||
|
'shk': 134,
|
||||||
|
'ënd': 135,
|
||||||
|
'ës ': 136,
|
||||||
|
' de': 137,
|
||||||
|
' kj': 138,
|
||||||
|
' ru': 139,
|
||||||
|
' vi': 140,
|
||||||
|
'ara': 141,
|
||||||
|
'gov': 142,
|
||||||
|
'kjo': 143,
|
||||||
|
'or ': 144,
|
||||||
|
'r p': 145,
|
||||||
|
'rto': 146,
|
||||||
|
'rug': 147,
|
||||||
|
'tet': 148,
|
||||||
|
'ugo': 149,
|
||||||
|
'ali': 150,
|
||||||
|
'arr': 151,
|
||||||
|
'at ': 152,
|
||||||
|
'd t': 153,
|
||||||
|
'ht ': 154,
|
||||||
|
'i p': 155,
|
||||||
|
'ipë': 156,
|
||||||
|
'izi': 157,
|
||||||
|
'jnë': 158,
|
||||||
|
'n n': 159,
|
||||||
|
'ohe': 160,
|
||||||
|
'shu': 161,
|
||||||
|
'shë': 162,
|
||||||
|
't e': 163,
|
||||||
|
'tik': 164,
|
||||||
|
'a e': 165,
|
||||||
|
'arë': 166,
|
||||||
|
'etë': 167,
|
||||||
|
'hum': 168,
|
||||||
|
'nd ': 169,
|
||||||
|
'ndr': 170,
|
||||||
|
'osh': 171,
|
||||||
|
'ova': 172,
|
||||||
|
'rim': 173,
|
||||||
|
'tos': 174,
|
||||||
|
'va ': 175,
|
||||||
|
' fa': 176,
|
||||||
|
' fi': 177,
|
||||||
|
'a s': 178,
|
||||||
|
'hen': 179,
|
||||||
|
'i n': 180,
|
||||||
|
'mar': 181,
|
||||||
|
'ndo': 182,
|
||||||
|
'por': 183,
|
||||||
|
'ris': 184,
|
||||||
|
'sa ': 185,
|
||||||
|
'sis': 186,
|
||||||
|
'tës': 187,
|
||||||
|
'umë': 188,
|
||||||
|
'viz': 189,
|
||||||
|
'zit': 190,
|
||||||
|
' di': 191,
|
||||||
|
' mb': 192,
|
||||||
|
'aj ': 193,
|
||||||
|
'ana': 194,
|
||||||
|
'ata': 195,
|
||||||
|
'dër': 196,
|
||||||
|
'e a': 197,
|
||||||
|
'esh': 198,
|
||||||
|
'ime': 199,
|
||||||
|
'jes': 200,
|
||||||
|
'lar': 201,
|
||||||
|
'n s': 202,
|
||||||
|
'nte': 203,
|
||||||
|
'pol': 204,
|
||||||
|
'r n': 205,
|
||||||
|
'ran': 206,
|
||||||
|
'res': 207,
|
||||||
|
'rrë': 208,
|
||||||
|
'tar': 209,
|
||||||
|
'ë a': 210,
|
||||||
|
'ë i': 211,
|
||||||
|
' at': 212,
|
||||||
|
' jo': 213,
|
||||||
|
' kë': 214,
|
||||||
|
' re': 215,
|
||||||
|
'a k': 216,
|
||||||
|
'ai ': 217,
|
||||||
|
'akt': 218,
|
||||||
|
'hë ': 219,
|
||||||
|
'hën': 220,
|
||||||
|
'i i': 221,
|
||||||
|
'i m': 222,
|
||||||
|
'ia ': 223,
|
||||||
|
'men': 224,
|
||||||
|
'nis': 225,
|
||||||
|
'shm': 226,
|
||||||
|
'str': 227,
|
||||||
|
't k': 228,
|
||||||
|
't n': 229,
|
||||||
|
't s': 230,
|
||||||
|
'ë g': 231,
|
||||||
|
'ërk': 232,
|
||||||
|
'ëve': 233,
|
||||||
|
' ai': 234,
|
||||||
|
' ci': 235,
|
||||||
|
' ed': 236,
|
||||||
|
' ja': 237,
|
||||||
|
' kr': 238,
|
||||||
|
' qe': 239,
|
||||||
|
' ta': 240,
|
||||||
|
' ve': 241,
|
||||||
|
'a p': 242,
|
||||||
|
'cil': 243,
|
||||||
|
'el ': 244,
|
||||||
|
'erë': 245,
|
||||||
|
'gji': 246,
|
||||||
|
'hte': 247,
|
||||||
|
'i t': 248,
|
||||||
|
'jen': 249,
|
||||||
|
'jit': 250,
|
||||||
|
'k d': 251,
|
||||||
|
'mën': 252,
|
||||||
|
'n t': 253,
|
||||||
|
'nyr': 254,
|
||||||
|
'ori': 255,
|
||||||
|
'pas': 256,
|
||||||
|
'ra ': 257,
|
||||||
|
'rie': 258,
|
||||||
|
'rës': 259,
|
||||||
|
'tor': 260,
|
||||||
|
'uaj': 261,
|
||||||
|
'yre': 262,
|
||||||
|
'ëm ': 263,
|
||||||
|
'ëny': 264,
|
||||||
|
' ar': 265,
|
||||||
|
' du': 266,
|
||||||
|
' ga': 267,
|
||||||
|
' je': 268,
|
||||||
|
'dës': 269,
|
||||||
|
'e e': 270,
|
||||||
|
'e z': 271,
|
||||||
|
'ha ': 272,
|
||||||
|
'hme': 273,
|
||||||
|
'ika': 274,
|
||||||
|
'ini': 275,
|
||||||
|
'ite': 276,
|
||||||
|
'ith': 277,
|
||||||
|
'koh': 278,
|
||||||
|
'kra': 279,
|
||||||
|
'ku ': 280,
|
||||||
|
'lim': 281,
|
||||||
|
'lis': 282,
|
||||||
|
'qën': 283,
|
||||||
|
'rën': 284,
|
||||||
|
's s': 285,
|
||||||
|
't d': 286,
|
||||||
|
't t': 287,
|
||||||
|
'tir': 288,
|
||||||
|
'tën': 289,
|
||||||
|
'ver': 290,
|
||||||
|
'ë j': 291,
|
||||||
|
' ba': 292,
|
||||||
|
' in': 293,
|
||||||
|
' tr': 294,
|
||||||
|
' zg': 295,
|
||||||
|
'a a': 296,
|
||||||
|
'a m': 297,
|
||||||
|
'a t': 298,
|
||||||
|
'abr': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/sr.py
Normal file
303
libs/guess_language/data/models/sr.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
' на': 0,
|
||||||
|
' је': 1,
|
||||||
|
' по': 2,
|
||||||
|
'је ': 3,
|
||||||
|
' и ': 4,
|
||||||
|
' не': 5,
|
||||||
|
' пр': 6,
|
||||||
|
'га ': 7,
|
||||||
|
' св': 8,
|
||||||
|
'ог ': 9,
|
||||||
|
'а с': 10,
|
||||||
|
'их ': 11,
|
||||||
|
'на ': 12,
|
||||||
|
'кој': 13,
|
||||||
|
'ога': 14,
|
||||||
|
' у ': 15,
|
||||||
|
'а п': 16,
|
||||||
|
'не ': 17,
|
||||||
|
'ни ': 18,
|
||||||
|
'ти ': 19,
|
||||||
|
' да': 20,
|
||||||
|
'ом ': 21,
|
||||||
|
' ве': 22,
|
||||||
|
' ср': 23,
|
||||||
|
'и с': 24,
|
||||||
|
'ско': 25,
|
||||||
|
' об': 26,
|
||||||
|
'а н': 27,
|
||||||
|
'да ': 28,
|
||||||
|
'е н': 29,
|
||||||
|
'но ': 30,
|
||||||
|
'ног': 31,
|
||||||
|
'о ј': 32,
|
||||||
|
'ој ': 33,
|
||||||
|
' за': 34,
|
||||||
|
'ва ': 35,
|
||||||
|
'е с': 36,
|
||||||
|
'и п': 37,
|
||||||
|
'ма ': 38,
|
||||||
|
'ник': 39,
|
||||||
|
'обр': 40,
|
||||||
|
'ова': 41,
|
||||||
|
' ко': 42,
|
||||||
|
'а и': 43,
|
||||||
|
'диј': 44,
|
||||||
|
'е п': 45,
|
||||||
|
'ка ': 46,
|
||||||
|
'ко ': 47,
|
||||||
|
'ког': 48,
|
||||||
|
'ост': 49,
|
||||||
|
'све': 50,
|
||||||
|
'ств': 51,
|
||||||
|
'сти': 52,
|
||||||
|
'тра': 53,
|
||||||
|
'еди': 54,
|
||||||
|
'има': 55,
|
||||||
|
'пок': 56,
|
||||||
|
'пра': 57,
|
||||||
|
'раз': 58,
|
||||||
|
'те ': 59,
|
||||||
|
' бо': 60,
|
||||||
|
' ви': 61,
|
||||||
|
' са': 62,
|
||||||
|
'аво': 63,
|
||||||
|
'бра': 64,
|
||||||
|
'гос': 65,
|
||||||
|
'е и': 66,
|
||||||
|
'ели': 67,
|
||||||
|
'ени': 68,
|
||||||
|
'за ': 69,
|
||||||
|
'ики': 70,
|
||||||
|
'ио ': 71,
|
||||||
|
'пре': 72,
|
||||||
|
'рав': 73,
|
||||||
|
'рад': 74,
|
||||||
|
'у с': 75,
|
||||||
|
'ју ': 76,
|
||||||
|
'ња ': 77,
|
||||||
|
' би': 78,
|
||||||
|
' до': 79,
|
||||||
|
' ст': 80,
|
||||||
|
'аст': 81,
|
||||||
|
'бој': 82,
|
||||||
|
'ебо': 83,
|
||||||
|
'и н': 84,
|
||||||
|
'им ': 85,
|
||||||
|
'ку ': 86,
|
||||||
|
'лан': 87,
|
||||||
|
'неб': 88,
|
||||||
|
'ово': 89,
|
||||||
|
'ого': 90,
|
||||||
|
'осл': 91,
|
||||||
|
'ојш': 92,
|
||||||
|
'пед': 93,
|
||||||
|
'стр': 94,
|
||||||
|
'час': 95,
|
||||||
|
' го': 96,
|
||||||
|
' кр': 97,
|
||||||
|
' мо': 98,
|
||||||
|
' чл': 99,
|
||||||
|
'а м': 100,
|
||||||
|
'а о': 101,
|
||||||
|
'ако': 102,
|
||||||
|
'ача': 103,
|
||||||
|
'вел': 104,
|
||||||
|
'вет': 105,
|
||||||
|
'вог': 106,
|
||||||
|
'еда': 107,
|
||||||
|
'ист': 108,
|
||||||
|
'ити': 109,
|
||||||
|
'ије': 110,
|
||||||
|
'око': 111,
|
||||||
|
'сло': 112,
|
||||||
|
'срб': 113,
|
||||||
|
'чла': 114,
|
||||||
|
' бе': 115,
|
||||||
|
' ос': 116,
|
||||||
|
' от': 117,
|
||||||
|
' ре': 118,
|
||||||
|
' се': 119,
|
||||||
|
'а в': 120,
|
||||||
|
'ан ': 121,
|
||||||
|
'бог': 122,
|
||||||
|
'бро': 123,
|
||||||
|
'вен': 124,
|
||||||
|
'гра': 125,
|
||||||
|
'е о': 126,
|
||||||
|
'ика': 127,
|
||||||
|
'ија': 128,
|
||||||
|
'ких': 129,
|
||||||
|
'ком': 130,
|
||||||
|
'ли ': 131,
|
||||||
|
'ну ': 132,
|
||||||
|
'ота': 133,
|
||||||
|
'ојн': 134,
|
||||||
|
'под': 135,
|
||||||
|
'рбс': 136,
|
||||||
|
'ред': 137,
|
||||||
|
'рој': 138,
|
||||||
|
'са ': 139,
|
||||||
|
'сни': 140,
|
||||||
|
'тач': 141,
|
||||||
|
'тва': 142,
|
||||||
|
'ја ': 143,
|
||||||
|
'ји ': 144,
|
||||||
|
' ка': 145,
|
||||||
|
' ов': 146,
|
||||||
|
' тр': 147,
|
||||||
|
'а ј': 148,
|
||||||
|
'ави': 149,
|
||||||
|
'аз ': 150,
|
||||||
|
'ано': 151,
|
||||||
|
'био': 152,
|
||||||
|
'вик': 153,
|
||||||
|
'во ': 154,
|
||||||
|
'гов': 155,
|
||||||
|
'дни': 156,
|
||||||
|
'е ч': 157,
|
||||||
|
'его': 158,
|
||||||
|
'и о': 159,
|
||||||
|
'ива': 160,
|
||||||
|
'иво': 161,
|
||||||
|
'ик ': 162,
|
||||||
|
'ине': 163,
|
||||||
|
'ини': 164,
|
||||||
|
'ипе': 165,
|
||||||
|
'кип': 166,
|
||||||
|
'лик': 167,
|
||||||
|
'ло ': 168,
|
||||||
|
'наш': 169,
|
||||||
|
'нос': 170,
|
||||||
|
'о т': 171,
|
||||||
|
'од ': 172,
|
||||||
|
'оди': 173,
|
||||||
|
'она': 174,
|
||||||
|
'оји': 175,
|
||||||
|
'поч': 176,
|
||||||
|
'про': 177,
|
||||||
|
'ра ': 178,
|
||||||
|
'рис': 179,
|
||||||
|
'род': 180,
|
||||||
|
'рст': 181,
|
||||||
|
'се ': 182,
|
||||||
|
'спо': 183,
|
||||||
|
'ста': 184,
|
||||||
|
'тић': 185,
|
||||||
|
'у д': 186,
|
||||||
|
'у н': 187,
|
||||||
|
'у о': 188,
|
||||||
|
'чин': 189,
|
||||||
|
'ша ': 190,
|
||||||
|
'јед': 191,
|
||||||
|
'јни': 192,
|
||||||
|
'ће ': 193,
|
||||||
|
' м ': 194,
|
||||||
|
' ме': 195,
|
||||||
|
' ни': 196,
|
||||||
|
' он': 197,
|
||||||
|
' па': 198,
|
||||||
|
' сл': 199,
|
||||||
|
' те': 200,
|
||||||
|
'а у': 201,
|
||||||
|
'ава': 202,
|
||||||
|
'аве': 203,
|
||||||
|
'авн': 204,
|
||||||
|
'ана': 205,
|
||||||
|
'ао ': 206,
|
||||||
|
'ати': 207,
|
||||||
|
'аци': 208,
|
||||||
|
'ају': 209,
|
||||||
|
'ања': 210,
|
||||||
|
'бск': 211,
|
||||||
|
'вор': 212,
|
||||||
|
'вос': 213,
|
||||||
|
'вск': 214,
|
||||||
|
'дин': 215,
|
||||||
|
'е у': 216,
|
||||||
|
'едн': 217,
|
||||||
|
'ези': 218,
|
||||||
|
'ека': 219,
|
||||||
|
'ено': 220,
|
||||||
|
'ето': 221,
|
||||||
|
'ења': 222,
|
||||||
|
'жив': 223,
|
||||||
|
'и г': 224,
|
||||||
|
'и и': 225,
|
||||||
|
'и к': 226,
|
||||||
|
'и т': 227,
|
||||||
|
'ику': 228,
|
||||||
|
'ичк': 229,
|
||||||
|
'ки ': 230,
|
||||||
|
'крс': 231,
|
||||||
|
'ла ': 232,
|
||||||
|
'лав': 233,
|
||||||
|
'лит': 234,
|
||||||
|
'ме ': 235,
|
||||||
|
'мен': 236,
|
||||||
|
'нац': 237,
|
||||||
|
'о н': 238,
|
||||||
|
'о п': 239,
|
||||||
|
'о у': 240,
|
||||||
|
'одн': 241,
|
||||||
|
'оли': 242,
|
||||||
|
'орн': 243,
|
||||||
|
'осн': 244,
|
||||||
|
'осп': 245,
|
||||||
|
'оче': 246,
|
||||||
|
'пск': 247,
|
||||||
|
'реч': 248,
|
||||||
|
'рпс': 249,
|
||||||
|
'сво': 250,
|
||||||
|
'ски': 251,
|
||||||
|
'сла': 252,
|
||||||
|
'срп': 253,
|
||||||
|
'су ': 254,
|
||||||
|
'та ': 255,
|
||||||
|
'тав': 256,
|
||||||
|
'тве': 257,
|
||||||
|
'у б': 258,
|
||||||
|
'јез': 259,
|
||||||
|
'ћи ': 260,
|
||||||
|
' ен': 261,
|
||||||
|
' жи': 262,
|
||||||
|
' им': 263,
|
||||||
|
' му': 264,
|
||||||
|
' од': 265,
|
||||||
|
' су': 266,
|
||||||
|
' та': 267,
|
||||||
|
' хр': 268,
|
||||||
|
' ча': 269,
|
||||||
|
' шт': 270,
|
||||||
|
' ње': 271,
|
||||||
|
'а д': 272,
|
||||||
|
'а з': 273,
|
||||||
|
'а к': 274,
|
||||||
|
'а т': 275,
|
||||||
|
'аду': 276,
|
||||||
|
'ало': 277,
|
||||||
|
'ани': 278,
|
||||||
|
'асо': 279,
|
||||||
|
'ван': 280,
|
||||||
|
'вач': 281,
|
||||||
|
'вањ': 282,
|
||||||
|
'вед': 283,
|
||||||
|
'ви ': 284,
|
||||||
|
'вно': 285,
|
||||||
|
'вот': 286,
|
||||||
|
'вој': 287,
|
||||||
|
'ву ': 288,
|
||||||
|
'доб': 289,
|
||||||
|
'дру': 290,
|
||||||
|
'дсе': 291,
|
||||||
|
'ду ': 292,
|
||||||
|
'е б': 293,
|
||||||
|
'е д': 294,
|
||||||
|
'е м': 295,
|
||||||
|
'ем ': 296,
|
||||||
|
'ема': 297,
|
||||||
|
'ент': 298,
|
||||||
|
'енц': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/ss.py
Normal file
303
libs/guess_language/data/models/ss.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
' ku': 0,
|
||||||
|
' le': 1,
|
||||||
|
'la ': 2,
|
||||||
|
'eku': 3,
|
||||||
|
'a k': 4,
|
||||||
|
'nga': 5,
|
||||||
|
' ng': 6,
|
||||||
|
'a n': 7,
|
||||||
|
'nge': 8,
|
||||||
|
'a l': 9,
|
||||||
|
'lo ': 10,
|
||||||
|
' ne': 11,
|
||||||
|
'eti': 12,
|
||||||
|
'kwe': 13,
|
||||||
|
'ndz': 14,
|
||||||
|
'e n': 15,
|
||||||
|
'o l': 16,
|
||||||
|
' lo': 17,
|
||||||
|
'ela': 18,
|
||||||
|
'ema': 19,
|
||||||
|
'ent': 20,
|
||||||
|
'si ': 21,
|
||||||
|
' kw': 22,
|
||||||
|
'tsi': 23,
|
||||||
|
'i l': 24,
|
||||||
|
'wa ': 25,
|
||||||
|
'lel': 26,
|
||||||
|
'kut': 27,
|
||||||
|
'e k': 28,
|
||||||
|
'und': 29,
|
||||||
|
'ni ': 30,
|
||||||
|
'elo': 31,
|
||||||
|
'fun': 32,
|
||||||
|
'esi': 33,
|
||||||
|
' si': 34,
|
||||||
|
'ele': 35,
|
||||||
|
'tin': 36,
|
||||||
|
'tfo': 37,
|
||||||
|
' ti': 38,
|
||||||
|
'le ': 39,
|
||||||
|
'kha': 40,
|
||||||
|
'tse': 41,
|
||||||
|
'e l': 42,
|
||||||
|
'pha': 43,
|
||||||
|
'ung': 44,
|
||||||
|
'i k': 45,
|
||||||
|
' em': 46,
|
||||||
|
'ti ': 47,
|
||||||
|
'sa ': 48,
|
||||||
|
' um': 49,
|
||||||
|
'isa': 50,
|
||||||
|
'eli': 51,
|
||||||
|
'ndl': 52,
|
||||||
|
'ing': 53,
|
||||||
|
'set': 54,
|
||||||
|
'we ': 55,
|
||||||
|
'ise': 56,
|
||||||
|
'na ': 57,
|
||||||
|
'ang': 58,
|
||||||
|
'etf': 59,
|
||||||
|
'khe': 60,
|
||||||
|
'and': 61,
|
||||||
|
'o n': 62,
|
||||||
|
' we': 63,
|
||||||
|
'nti': 64,
|
||||||
|
'nye': 65,
|
||||||
|
'tfu': 66,
|
||||||
|
'ben': 67,
|
||||||
|
'a e': 68,
|
||||||
|
'uts': 69,
|
||||||
|
'let': 70,
|
||||||
|
'dza': 71,
|
||||||
|
'imi': 72,
|
||||||
|
'sek': 73,
|
||||||
|
'ko ': 74,
|
||||||
|
'lok': 75,
|
||||||
|
'eni': 76,
|
||||||
|
'ye ': 77,
|
||||||
|
'ba ': 78,
|
||||||
|
'nkh': 79,
|
||||||
|
'ebe': 80,
|
||||||
|
'alo': 81,
|
||||||
|
'o k': 82,
|
||||||
|
'lan': 83,
|
||||||
|
'ga ': 84,
|
||||||
|
'aba': 85,
|
||||||
|
'seb': 86,
|
||||||
|
' ye': 87,
|
||||||
|
'he ': 88,
|
||||||
|
'lwa': 89,
|
||||||
|
'kel': 90,
|
||||||
|
' te': 91,
|
||||||
|
' la': 92,
|
||||||
|
'kus': 93,
|
||||||
|
'wem': 94,
|
||||||
|
'ati': 95,
|
||||||
|
'ikh': 96,
|
||||||
|
'nek': 97,
|
||||||
|
'ala': 98,
|
||||||
|
'kuf': 99,
|
||||||
|
'i n': 100,
|
||||||
|
'oku': 101,
|
||||||
|
'ats': 102,
|
||||||
|
'mts': 103,
|
||||||
|
'hla': 104,
|
||||||
|
'wen': 105,
|
||||||
|
'a t': 106,
|
||||||
|
' na': 107,
|
||||||
|
'gek': 108,
|
||||||
|
'uhl': 109,
|
||||||
|
'kub': 110,
|
||||||
|
'ngu': 111,
|
||||||
|
'ka ': 112,
|
||||||
|
'aka': 113,
|
||||||
|
'fut': 114,
|
||||||
|
'kan': 115,
|
||||||
|
'kwa': 116,
|
||||||
|
' li': 117,
|
||||||
|
'kuc': 118,
|
||||||
|
'onk': 119,
|
||||||
|
'ban': 120,
|
||||||
|
'ana': 121,
|
||||||
|
'ulu': 122,
|
||||||
|
' se': 123,
|
||||||
|
' im': 124,
|
||||||
|
'akh': 125,
|
||||||
|
'ume': 126,
|
||||||
|
'a i': 127,
|
||||||
|
'les': 128,
|
||||||
|
'tim': 129,
|
||||||
|
'ula': 130,
|
||||||
|
'ini': 131,
|
||||||
|
'lwe': 132,
|
||||||
|
'za ': 133,
|
||||||
|
'fo ': 134,
|
||||||
|
'hul': 135,
|
||||||
|
' no': 136,
|
||||||
|
'han': 137,
|
||||||
|
'li ': 138,
|
||||||
|
'iph': 139,
|
||||||
|
'a s': 140,
|
||||||
|
'tis': 141,
|
||||||
|
'khu': 142,
|
||||||
|
'ta ': 143,
|
||||||
|
'dzi': 144,
|
||||||
|
'be ': 145,
|
||||||
|
'emi': 146,
|
||||||
|
'ma ': 147,
|
||||||
|
'end': 148,
|
||||||
|
'o t': 149,
|
||||||
|
'eke': 150,
|
||||||
|
'a u': 151,
|
||||||
|
' ka': 152,
|
||||||
|
'ane': 153,
|
||||||
|
'lek': 154,
|
||||||
|
'mel': 155,
|
||||||
|
'elw': 156,
|
||||||
|
'kun': 157,
|
||||||
|
'sis': 158,
|
||||||
|
'lon': 159,
|
||||||
|
'utf': 160,
|
||||||
|
'any': 161,
|
||||||
|
'kho': 162,
|
||||||
|
'kul': 163,
|
||||||
|
'hlo': 164,
|
||||||
|
' ba': 165,
|
||||||
|
'ufu': 166,
|
||||||
|
'aph': 167,
|
||||||
|
'lun': 168,
|
||||||
|
'e s': 169,
|
||||||
|
'hal': 170,
|
||||||
|
'ind': 171,
|
||||||
|
'isw': 172,
|
||||||
|
'o s': 173,
|
||||||
|
'use': 174,
|
||||||
|
'ekw': 175,
|
||||||
|
'me ': 176,
|
||||||
|
'ndv': 177,
|
||||||
|
'eng': 178,
|
||||||
|
'uph': 179,
|
||||||
|
'hat': 180,
|
||||||
|
'ne ': 181,
|
||||||
|
'so ': 182,
|
||||||
|
'lul': 183,
|
||||||
|
'nom': 184,
|
||||||
|
'te ': 185,
|
||||||
|
'lol': 186,
|
||||||
|
'awu': 187,
|
||||||
|
'nel': 188,
|
||||||
|
'lu ': 189,
|
||||||
|
'ha ': 190,
|
||||||
|
'wat': 191,
|
||||||
|
'men': 192,
|
||||||
|
'ete': 193,
|
||||||
|
' lw': 194,
|
||||||
|
'nem': 195,
|
||||||
|
'ako': 196,
|
||||||
|
'zin': 197,
|
||||||
|
'kuh': 198,
|
||||||
|
'sha': 199,
|
||||||
|
'bha': 200,
|
||||||
|
'gab': 201,
|
||||||
|
' in': 202,
|
||||||
|
'ale': 203,
|
||||||
|
'mis': 204,
|
||||||
|
'tem': 205,
|
||||||
|
'e e': 206,
|
||||||
|
'o e': 207,
|
||||||
|
'e t': 208,
|
||||||
|
'wek': 209,
|
||||||
|
'dze': 210,
|
||||||
|
'ome': 211,
|
||||||
|
'wel': 212,
|
||||||
|
' lu': 213,
|
||||||
|
'emb': 214,
|
||||||
|
'nis': 215,
|
||||||
|
' ek': 216,
|
||||||
|
'tsa': 217,
|
||||||
|
'u l': 218,
|
||||||
|
'o y': 219,
|
||||||
|
'dle': 220,
|
||||||
|
'ute': 221,
|
||||||
|
'len': 222,
|
||||||
|
'swa': 223,
|
||||||
|
'phe': 224,
|
||||||
|
'mkh': 225,
|
||||||
|
'ntf': 226,
|
||||||
|
'uke': 227,
|
||||||
|
'sit': 228,
|
||||||
|
'iny': 229,
|
||||||
|
'e i': 230,
|
||||||
|
'wo ': 231,
|
||||||
|
'ani': 232,
|
||||||
|
'phi': 233,
|
||||||
|
'wet': 234,
|
||||||
|
'sin': 235,
|
||||||
|
'nhl': 236,
|
||||||
|
'mal': 237,
|
||||||
|
'mba': 238,
|
||||||
|
'mfu': 239,
|
||||||
|
'fu ': 240,
|
||||||
|
'lab': 241,
|
||||||
|
'sik': 242,
|
||||||
|
'taw': 243,
|
||||||
|
'no ': 244,
|
||||||
|
'hle': 245,
|
||||||
|
'e u': 246,
|
||||||
|
'eki': 247,
|
||||||
|
'ase': 248,
|
||||||
|
'ali': 249,
|
||||||
|
'ulw': 250,
|
||||||
|
've ': 251,
|
||||||
|
'eka': 252,
|
||||||
|
'zel': 253,
|
||||||
|
'nta': 254,
|
||||||
|
'bon': 255,
|
||||||
|
'tek': 256,
|
||||||
|
'bo ': 257,
|
||||||
|
'sig': 258,
|
||||||
|
'ama': 259,
|
||||||
|
'ile': 260,
|
||||||
|
'ule': 261,
|
||||||
|
'tfw': 262,
|
||||||
|
'mph': 263,
|
||||||
|
'uma': 264,
|
||||||
|
'kup': 265,
|
||||||
|
'emt': 266,
|
||||||
|
'asi': 267,
|
||||||
|
'dlu': 268,
|
||||||
|
'ish': 269,
|
||||||
|
'umt': 270,
|
||||||
|
'gen': 271,
|
||||||
|
'o w': 272,
|
||||||
|
'ike': 273,
|
||||||
|
'iga': 274,
|
||||||
|
'hak': 275,
|
||||||
|
'abe': 276,
|
||||||
|
'net': 277,
|
||||||
|
'gan': 278,
|
||||||
|
'kis': 279,
|
||||||
|
'nde': 280,
|
||||||
|
'ngi': 281,
|
||||||
|
'ukh': 282,
|
||||||
|
'bek': 283,
|
||||||
|
'mo ': 284,
|
||||||
|
'phu': 285,
|
||||||
|
'sel': 286,
|
||||||
|
'elu': 287,
|
||||||
|
'i t': 288,
|
||||||
|
'ant': 289,
|
||||||
|
'dvo': 290,
|
||||||
|
'a y': 291,
|
||||||
|
'vo ': 292,
|
||||||
|
'hum': 293,
|
||||||
|
'lis': 294,
|
||||||
|
'dla': 295,
|
||||||
|
'gam': 296,
|
||||||
|
'ive': 297,
|
||||||
|
'jen': 298,
|
||||||
|
'ket': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/st.py
Normal file
303
libs/guess_language/data/models/st.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'ng ': 0,
|
||||||
|
'ho ': 1,
|
||||||
|
' le': 2,
|
||||||
|
'le ': 3,
|
||||||
|
' ho': 4,
|
||||||
|
' ts': 5,
|
||||||
|
'a m': 6,
|
||||||
|
'sa ': 7,
|
||||||
|
'la ': 8,
|
||||||
|
' ka': 9,
|
||||||
|
'a h': 10,
|
||||||
|
' di': 11,
|
||||||
|
'ya ': 12,
|
||||||
|
'ka ': 13,
|
||||||
|
' ya': 14,
|
||||||
|
'a t': 15,
|
||||||
|
'eng': 16,
|
||||||
|
'ets': 17,
|
||||||
|
' ba': 18,
|
||||||
|
' mo': 19,
|
||||||
|
'a l': 20,
|
||||||
|
' se': 21,
|
||||||
|
'lo ': 22,
|
||||||
|
' bo': 23,
|
||||||
|
'wa ': 24,
|
||||||
|
'tsa': 25,
|
||||||
|
'a b': 26,
|
||||||
|
'na ': 27,
|
||||||
|
'ba ': 28,
|
||||||
|
' e ': 29,
|
||||||
|
' a ': 30,
|
||||||
|
'a k': 31,
|
||||||
|
' ma': 32,
|
||||||
|
'ang': 33,
|
||||||
|
'tse': 34,
|
||||||
|
'se ': 35,
|
||||||
|
'o t': 36,
|
||||||
|
'a d': 37,
|
||||||
|
'a s': 38,
|
||||||
|
'ha ': 39,
|
||||||
|
'so ': 40,
|
||||||
|
'o l': 41,
|
||||||
|
'e h': 42,
|
||||||
|
'o y': 43,
|
||||||
|
'e t': 44,
|
||||||
|
'tla': 45,
|
||||||
|
'tsh': 46,
|
||||||
|
'olo': 47,
|
||||||
|
'e l': 48,
|
||||||
|
'e m': 49,
|
||||||
|
'o b': 50,
|
||||||
|
'o e': 51,
|
||||||
|
'seb': 52,
|
||||||
|
'ebe': 53,
|
||||||
|
'ela': 54,
|
||||||
|
'thu': 55,
|
||||||
|
'ele': 56,
|
||||||
|
'e k': 57,
|
||||||
|
'ana': 58,
|
||||||
|
'e b': 59,
|
||||||
|
' th': 60,
|
||||||
|
' ha': 61,
|
||||||
|
'tso': 62,
|
||||||
|
'o a': 63,
|
||||||
|
'o k': 64,
|
||||||
|
' wa': 65,
|
||||||
|
'kgo': 66,
|
||||||
|
'tsw': 67,
|
||||||
|
'tho': 68,
|
||||||
|
'o h': 69,
|
||||||
|
'ong': 70,
|
||||||
|
' la': 71,
|
||||||
|
'hut': 72,
|
||||||
|
'dit': 73,
|
||||||
|
'ane': 74,
|
||||||
|
' me': 75,
|
||||||
|
'a e': 76,
|
||||||
|
' tl': 77,
|
||||||
|
'ola': 78,
|
||||||
|
'edi': 79,
|
||||||
|
'elo': 80,
|
||||||
|
'di ': 81,
|
||||||
|
'ona': 82,
|
||||||
|
' ke': 83,
|
||||||
|
'wan': 84,
|
||||||
|
' o ': 85,
|
||||||
|
'a p': 86,
|
||||||
|
'apa': 87,
|
||||||
|
'tjh': 88,
|
||||||
|
'hlo': 89,
|
||||||
|
' sa': 90,
|
||||||
|
'she': 91,
|
||||||
|
'let': 92,
|
||||||
|
'aba': 93,
|
||||||
|
'lok': 94,
|
||||||
|
'lao': 95,
|
||||||
|
'eo ': 96,
|
||||||
|
'a a': 97,
|
||||||
|
'o s': 98,
|
||||||
|
'man': 99,
|
||||||
|
'to ': 100,
|
||||||
|
' hl': 101,
|
||||||
|
'a n': 102,
|
||||||
|
'isa': 103,
|
||||||
|
'e d': 104,
|
||||||
|
'swe': 105,
|
||||||
|
'set': 106,
|
||||||
|
'pa ': 107,
|
||||||
|
' na': 108,
|
||||||
|
'o m': 109,
|
||||||
|
'g l': 110,
|
||||||
|
'het': 111,
|
||||||
|
' kg': 112,
|
||||||
|
'got': 113,
|
||||||
|
'aha': 114,
|
||||||
|
'eth': 115,
|
||||||
|
're ': 116,
|
||||||
|
'e e': 117,
|
||||||
|
'jha': 118,
|
||||||
|
'phe': 119,
|
||||||
|
'lan': 120,
|
||||||
|
'otl': 121,
|
||||||
|
'g k': 122,
|
||||||
|
'lek': 123,
|
||||||
|
'its': 124,
|
||||||
|
'ekg': 125,
|
||||||
|
'sen': 126,
|
||||||
|
'ao ': 127,
|
||||||
|
'dis': 128,
|
||||||
|
'g m': 129,
|
||||||
|
'oth': 130,
|
||||||
|
'e a': 131,
|
||||||
|
'ith': 132,
|
||||||
|
'hla': 133,
|
||||||
|
'e s': 134,
|
||||||
|
'ke ': 135,
|
||||||
|
'mol': 136,
|
||||||
|
'pel': 137,
|
||||||
|
'g h': 138,
|
||||||
|
'hab': 139,
|
||||||
|
'bet': 140,
|
||||||
|
'san': 141,
|
||||||
|
'ats': 142,
|
||||||
|
'mo ': 143,
|
||||||
|
'lwa': 144,
|
||||||
|
'we ': 145,
|
||||||
|
'ala': 146,
|
||||||
|
'len': 147,
|
||||||
|
'nts': 148,
|
||||||
|
'dip': 149,
|
||||||
|
'kap': 150,
|
||||||
|
'iso': 151,
|
||||||
|
' mm': 152,
|
||||||
|
'uto': 153,
|
||||||
|
'alo': 154,
|
||||||
|
'e n': 155,
|
||||||
|
'si ': 156,
|
||||||
|
'ta ': 157,
|
||||||
|
'o w': 158,
|
||||||
|
'emo': 159,
|
||||||
|
'swa': 160,
|
||||||
|
'tsi': 161,
|
||||||
|
'oke': 162,
|
||||||
|
'bed': 163,
|
||||||
|
'the': 164,
|
||||||
|
' ph': 165,
|
||||||
|
'a y': 166,
|
||||||
|
'wen': 167,
|
||||||
|
'ken': 168,
|
||||||
|
'ena': 169,
|
||||||
|
'hwa': 170,
|
||||||
|
'ne ': 171,
|
||||||
|
'ore': 172,
|
||||||
|
'atl': 173,
|
||||||
|
'ano': 174,
|
||||||
|
'hel': 175,
|
||||||
|
'mot': 176,
|
||||||
|
'bo ': 177,
|
||||||
|
'g t': 178,
|
||||||
|
'i b': 179,
|
||||||
|
'kga': 180,
|
||||||
|
'hor': 181,
|
||||||
|
'ngo': 182,
|
||||||
|
'nan': 183,
|
||||||
|
'no ': 184,
|
||||||
|
'o n': 185,
|
||||||
|
'tlh': 186,
|
||||||
|
'shw': 187,
|
||||||
|
'kel': 188,
|
||||||
|
'pha': 189,
|
||||||
|
'etj': 190,
|
||||||
|
'bon': 191,
|
||||||
|
'ell': 192,
|
||||||
|
'g s': 193,
|
||||||
|
'gol': 194,
|
||||||
|
'tha': 195,
|
||||||
|
'ale': 196,
|
||||||
|
'dik': 197,
|
||||||
|
'kol': 198,
|
||||||
|
'bak': 199,
|
||||||
|
' nt': 200,
|
||||||
|
'ika': 201,
|
||||||
|
'o d': 202,
|
||||||
|
' te': 203,
|
||||||
|
'ohl': 204,
|
||||||
|
'g y': 205,
|
||||||
|
' lo': 206,
|
||||||
|
'ti ': 207,
|
||||||
|
'his': 208,
|
||||||
|
'ile': 209,
|
||||||
|
'g b': 210,
|
||||||
|
'oko': 211,
|
||||||
|
' et': 212,
|
||||||
|
'han': 213,
|
||||||
|
'a o': 214,
|
||||||
|
'mat': 215,
|
||||||
|
'oho': 216,
|
||||||
|
'odi': 217,
|
||||||
|
'lel': 218,
|
||||||
|
'mel': 219,
|
||||||
|
'din': 220,
|
||||||
|
'kar': 221,
|
||||||
|
'o o': 222,
|
||||||
|
'uo ': 223,
|
||||||
|
'mon': 224,
|
||||||
|
'hah': 225,
|
||||||
|
'te ': 226,
|
||||||
|
'me ': 227,
|
||||||
|
' it': 228,
|
||||||
|
'o f': 229,
|
||||||
|
'nen': 230,
|
||||||
|
'heb': 231,
|
||||||
|
'ing': 232,
|
||||||
|
'bol': 233,
|
||||||
|
'bel': 234,
|
||||||
|
'hle': 235,
|
||||||
|
'puo': 236,
|
||||||
|
'lal': 237,
|
||||||
|
'tlo': 238,
|
||||||
|
'hal': 239,
|
||||||
|
'oph': 240,
|
||||||
|
'eba': 241,
|
||||||
|
'hat': 242,
|
||||||
|
'heo': 243,
|
||||||
|
'aro': 244,
|
||||||
|
'bat': 245,
|
||||||
|
'ko ': 246,
|
||||||
|
'ban': 247,
|
||||||
|
'leh': 248,
|
||||||
|
'o i': 249,
|
||||||
|
'ole': 250,
|
||||||
|
'tle': 251,
|
||||||
|
' fe': 252,
|
||||||
|
'kge': 253,
|
||||||
|
'pan': 254,
|
||||||
|
'ake': 255,
|
||||||
|
'g e': 256,
|
||||||
|
'aka': 257,
|
||||||
|
'eko': 258,
|
||||||
|
' pe': 259,
|
||||||
|
'rik': 260,
|
||||||
|
'e y': 261,
|
||||||
|
'mme': 262,
|
||||||
|
'ama': 263,
|
||||||
|
'lha': 264,
|
||||||
|
'eha': 265,
|
||||||
|
' fa': 266,
|
||||||
|
'ebo': 267,
|
||||||
|
'moh': 268,
|
||||||
|
'mae': 269,
|
||||||
|
'ete': 270,
|
||||||
|
'aem': 271,
|
||||||
|
'ots': 272,
|
||||||
|
'ahi': 273,
|
||||||
|
'o p': 274,
|
||||||
|
'uta': 275,
|
||||||
|
'okg': 276,
|
||||||
|
'ntl': 277,
|
||||||
|
'pal': 278,
|
||||||
|
'get': 279,
|
||||||
|
'i l': 280,
|
||||||
|
'e f': 281,
|
||||||
|
'oka': 282,
|
||||||
|
'sep': 283,
|
||||||
|
'lat': 284,
|
||||||
|
'ahl': 285,
|
||||||
|
'bot': 286,
|
||||||
|
'ese': 287,
|
||||||
|
'lah': 288,
|
||||||
|
'lon': 289,
|
||||||
|
'akg': 290,
|
||||||
|
'a f': 291,
|
||||||
|
' pu': 292,
|
||||||
|
'ase': 293,
|
||||||
|
'g a': 294,
|
||||||
|
'mor': 295,
|
||||||
|
'kan': 296,
|
||||||
|
'nah': 297,
|
||||||
|
'boh': 298,
|
||||||
|
'e p': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/sv.py
Normal file
303
libs/guess_language/data/models/sv.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'en ': 0,
|
||||||
|
' de': 1,
|
||||||
|
'et ': 2,
|
||||||
|
'er ': 3,
|
||||||
|
'tt ': 4,
|
||||||
|
'om ': 5,
|
||||||
|
'för': 6,
|
||||||
|
'ar ': 7,
|
||||||
|
'de ': 8,
|
||||||
|
'att': 9,
|
||||||
|
' fö': 10,
|
||||||
|
'ing': 11,
|
||||||
|
' in': 12,
|
||||||
|
' at': 13,
|
||||||
|
' i ': 14,
|
||||||
|
'det': 15,
|
||||||
|
'ch ': 16,
|
||||||
|
'an ': 17,
|
||||||
|
'gen': 18,
|
||||||
|
' an': 19,
|
||||||
|
't s': 20,
|
||||||
|
'som': 21,
|
||||||
|
'te ': 22,
|
||||||
|
' oc': 23,
|
||||||
|
'ter': 24,
|
||||||
|
' ha': 25,
|
||||||
|
'lle': 26,
|
||||||
|
'och': 27,
|
||||||
|
' sk': 28,
|
||||||
|
' so': 29,
|
||||||
|
'ra ': 30,
|
||||||
|
'r a': 31,
|
||||||
|
' me': 32,
|
||||||
|
'var': 33,
|
||||||
|
'nde': 34,
|
||||||
|
'är ': 35,
|
||||||
|
' ko': 36,
|
||||||
|
'on ': 37,
|
||||||
|
'ans': 38,
|
||||||
|
'int': 39,
|
||||||
|
'n s': 40,
|
||||||
|
'na ': 41,
|
||||||
|
' en': 42,
|
||||||
|
' fr': 43,
|
||||||
|
' på': 44,
|
||||||
|
' st': 45,
|
||||||
|
' va': 46,
|
||||||
|
'and': 47,
|
||||||
|
'nte': 48,
|
||||||
|
'på ': 49,
|
||||||
|
'ska': 50,
|
||||||
|
'ta ': 51,
|
||||||
|
' vi': 52,
|
||||||
|
'der': 53,
|
||||||
|
'äll': 54,
|
||||||
|
'örs': 55,
|
||||||
|
' om': 56,
|
||||||
|
'da ': 57,
|
||||||
|
'kri': 58,
|
||||||
|
'ka ': 59,
|
||||||
|
'nst': 60,
|
||||||
|
' ho': 61,
|
||||||
|
'as ': 62,
|
||||||
|
'stä': 63,
|
||||||
|
'r d': 64,
|
||||||
|
't f': 65,
|
||||||
|
'upp': 66,
|
||||||
|
' be': 67,
|
||||||
|
'nge': 68,
|
||||||
|
'r s': 69,
|
||||||
|
'tal': 70,
|
||||||
|
'täl': 71,
|
||||||
|
'ör ': 72,
|
||||||
|
' av': 73,
|
||||||
|
'ger': 74,
|
||||||
|
'ill': 75,
|
||||||
|
'ng ': 76,
|
||||||
|
'e s': 77,
|
||||||
|
'ekt': 78,
|
||||||
|
'ade': 79,
|
||||||
|
'era': 80,
|
||||||
|
'ers': 81,
|
||||||
|
'har': 82,
|
||||||
|
'll ': 83,
|
||||||
|
'lld': 84,
|
||||||
|
'rin': 85,
|
||||||
|
'rna': 86,
|
||||||
|
'säk': 87,
|
||||||
|
'und': 88,
|
||||||
|
'inn': 89,
|
||||||
|
'lig': 90,
|
||||||
|
'ns ': 91,
|
||||||
|
' ma': 92,
|
||||||
|
' pr': 93,
|
||||||
|
' up': 94,
|
||||||
|
'age': 95,
|
||||||
|
'av ': 96,
|
||||||
|
'iva': 97,
|
||||||
|
'kti': 98,
|
||||||
|
'lda': 99,
|
||||||
|
'orn': 100,
|
||||||
|
'son': 101,
|
||||||
|
'ts ': 102,
|
||||||
|
'tta': 103,
|
||||||
|
'äkr': 104,
|
||||||
|
' sj': 105,
|
||||||
|
' ti': 106,
|
||||||
|
'avt': 107,
|
||||||
|
'ber': 108,
|
||||||
|
'els': 109,
|
||||||
|
'eta': 110,
|
||||||
|
'kol': 111,
|
||||||
|
'men': 112,
|
||||||
|
'n d': 113,
|
||||||
|
't k': 114,
|
||||||
|
'vta': 115,
|
||||||
|
'år ': 116,
|
||||||
|
'juk': 117,
|
||||||
|
'man': 118,
|
||||||
|
'n f': 119,
|
||||||
|
'nin': 120,
|
||||||
|
'r i': 121,
|
||||||
|
'rsä': 122,
|
||||||
|
'sju': 123,
|
||||||
|
'sso': 124,
|
||||||
|
' är': 125,
|
||||||
|
'a s': 126,
|
||||||
|
'ach': 127,
|
||||||
|
'ag ': 128,
|
||||||
|
'bac': 129,
|
||||||
|
'den': 130,
|
||||||
|
'ett': 131,
|
||||||
|
'fte': 132,
|
||||||
|
'hor': 133,
|
||||||
|
'nba': 134,
|
||||||
|
'oll': 135,
|
||||||
|
'rnb': 136,
|
||||||
|
'ste': 137,
|
||||||
|
'til': 138,
|
||||||
|
' ef': 139,
|
||||||
|
' si': 140,
|
||||||
|
'a a': 141,
|
||||||
|
'e h': 142,
|
||||||
|
'ed ': 143,
|
||||||
|
'eft': 144,
|
||||||
|
'ga ': 145,
|
||||||
|
'ig ': 146,
|
||||||
|
'it ': 147,
|
||||||
|
'ler': 148,
|
||||||
|
'med': 149,
|
||||||
|
'n i': 150,
|
||||||
|
'nd ': 151,
|
||||||
|
'så ': 152,
|
||||||
|
'tiv': 153,
|
||||||
|
' bl': 154,
|
||||||
|
' et': 155,
|
||||||
|
' fi': 156,
|
||||||
|
' sä': 157,
|
||||||
|
'at ': 158,
|
||||||
|
'des': 159,
|
||||||
|
'e a': 160,
|
||||||
|
'gar': 161,
|
||||||
|
'get': 162,
|
||||||
|
'lan': 163,
|
||||||
|
'lss': 164,
|
||||||
|
'ost': 165,
|
||||||
|
'r b': 166,
|
||||||
|
'r e': 167,
|
||||||
|
're ': 168,
|
||||||
|
'ret': 169,
|
||||||
|
'sta': 170,
|
||||||
|
't i': 171,
|
||||||
|
' ge': 172,
|
||||||
|
' he': 173,
|
||||||
|
' re': 174,
|
||||||
|
'a f': 175,
|
||||||
|
'all': 176,
|
||||||
|
'bos': 177,
|
||||||
|
'ets': 178,
|
||||||
|
'lek': 179,
|
||||||
|
'let': 180,
|
||||||
|
'ner': 181,
|
||||||
|
'nna': 182,
|
||||||
|
'nne': 183,
|
||||||
|
'r f': 184,
|
||||||
|
'rit': 185,
|
||||||
|
's s': 186,
|
||||||
|
'sen': 187,
|
||||||
|
'sto': 188,
|
||||||
|
'tor': 189,
|
||||||
|
'vav': 190,
|
||||||
|
'ygg': 191,
|
||||||
|
' ka': 192,
|
||||||
|
' så': 193,
|
||||||
|
' tr': 194,
|
||||||
|
' ut': 195,
|
||||||
|
'ad ': 196,
|
||||||
|
'al ': 197,
|
||||||
|
'are': 198,
|
||||||
|
'e o': 199,
|
||||||
|
'gon': 200,
|
||||||
|
'kom': 201,
|
||||||
|
'n a': 202,
|
||||||
|
'n h': 203,
|
||||||
|
'nga': 204,
|
||||||
|
'r h': 205,
|
||||||
|
'ren': 206,
|
||||||
|
't d': 207,
|
||||||
|
'tag': 208,
|
||||||
|
'tar': 209,
|
||||||
|
'tre': 210,
|
||||||
|
'ätt': 211,
|
||||||
|
' få': 212,
|
||||||
|
' hä': 213,
|
||||||
|
' se': 214,
|
||||||
|
'a d': 215,
|
||||||
|
'a i': 216,
|
||||||
|
'a p': 217,
|
||||||
|
'ale': 218,
|
||||||
|
'ann': 219,
|
||||||
|
'ara': 220,
|
||||||
|
'byg': 221,
|
||||||
|
'gt ': 222,
|
||||||
|
'han': 223,
|
||||||
|
'igt': 224,
|
||||||
|
'kan': 225,
|
||||||
|
'la ': 226,
|
||||||
|
'n o': 227,
|
||||||
|
'nom': 228,
|
||||||
|
'nsk': 229,
|
||||||
|
'omm': 230,
|
||||||
|
'r k': 231,
|
||||||
|
'r p': 232,
|
||||||
|
'r v': 233,
|
||||||
|
's f': 234,
|
||||||
|
's k': 235,
|
||||||
|
't a': 236,
|
||||||
|
't p': 237,
|
||||||
|
'ver': 238,
|
||||||
|
' bo': 239,
|
||||||
|
' br': 240,
|
||||||
|
' ku': 241,
|
||||||
|
' nå': 242,
|
||||||
|
'a b': 243,
|
||||||
|
'a e': 244,
|
||||||
|
'del': 245,
|
||||||
|
'ens': 246,
|
||||||
|
'es ': 247,
|
||||||
|
'fin': 248,
|
||||||
|
'ige': 249,
|
||||||
|
'm s': 250,
|
||||||
|
'n p': 251,
|
||||||
|
'någ': 252,
|
||||||
|
'or ': 253,
|
||||||
|
'r o': 254,
|
||||||
|
'rbe': 255,
|
||||||
|
'rs ': 256,
|
||||||
|
'rt ': 257,
|
||||||
|
's a': 258,
|
||||||
|
's n': 259,
|
||||||
|
'skr': 260,
|
||||||
|
't o': 261,
|
||||||
|
'ten': 262,
|
||||||
|
'tio': 263,
|
||||||
|
'ven': 264,
|
||||||
|
' al': 265,
|
||||||
|
' ja': 266,
|
||||||
|
' p ': 267,
|
||||||
|
' r ': 268,
|
||||||
|
' sa': 269,
|
||||||
|
'a h': 270,
|
||||||
|
'bet': 271,
|
||||||
|
'cke': 272,
|
||||||
|
'dra': 273,
|
||||||
|
'e f': 274,
|
||||||
|
'e i': 275,
|
||||||
|
'eda': 276,
|
||||||
|
'eno': 277,
|
||||||
|
'erä': 278,
|
||||||
|
'ess': 279,
|
||||||
|
'ion': 280,
|
||||||
|
'jag': 281,
|
||||||
|
'm f': 282,
|
||||||
|
'ne ': 283,
|
||||||
|
'nns': 284,
|
||||||
|
'pro': 285,
|
||||||
|
'r t': 286,
|
||||||
|
'rar': 287,
|
||||||
|
'riv': 288,
|
||||||
|
'rät': 289,
|
||||||
|
't e': 290,
|
||||||
|
't t': 291,
|
||||||
|
'ust': 292,
|
||||||
|
'vad': 293,
|
||||||
|
'öre': 294,
|
||||||
|
' ar': 295,
|
||||||
|
' by': 296,
|
||||||
|
' kr': 297,
|
||||||
|
' mi': 298,
|
||||||
|
'arb': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/sw.py
Normal file
303
libs/guess_language/data/models/sw.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
' wa': 0,
|
||||||
|
'wa ': 1,
|
||||||
|
'a k': 2,
|
||||||
|
'a m': 3,
|
||||||
|
' ku': 4,
|
||||||
|
' ya': 5,
|
||||||
|
'a w': 6,
|
||||||
|
'ya ': 7,
|
||||||
|
'ni ': 8,
|
||||||
|
' ma': 9,
|
||||||
|
'ka ': 10,
|
||||||
|
'a u': 11,
|
||||||
|
'na ': 12,
|
||||||
|
'za ': 13,
|
||||||
|
'ia ': 14,
|
||||||
|
' na': 15,
|
||||||
|
'ika': 16,
|
||||||
|
'ma ': 17,
|
||||||
|
'ali': 18,
|
||||||
|
'a n': 19,
|
||||||
|
' am': 20,
|
||||||
|
'ili': 21,
|
||||||
|
'kwa': 22,
|
||||||
|
' kw': 23,
|
||||||
|
'ini': 24,
|
||||||
|
' ha': 25,
|
||||||
|
'ame': 26,
|
||||||
|
'ana': 27,
|
||||||
|
'i n': 28,
|
||||||
|
' za': 29,
|
||||||
|
'a h': 30,
|
||||||
|
'ema': 31,
|
||||||
|
'i m': 32,
|
||||||
|
'i y': 33,
|
||||||
|
'kuw': 34,
|
||||||
|
'la ': 35,
|
||||||
|
'o w': 36,
|
||||||
|
'a y': 37,
|
||||||
|
'ata': 38,
|
||||||
|
'sem': 39,
|
||||||
|
' la': 40,
|
||||||
|
'ati': 41,
|
||||||
|
'chi': 42,
|
||||||
|
'i w': 43,
|
||||||
|
'uwa': 44,
|
||||||
|
'aki': 45,
|
||||||
|
'li ': 46,
|
||||||
|
'eka': 47,
|
||||||
|
'ira': 48,
|
||||||
|
' nc': 49,
|
||||||
|
'a s': 50,
|
||||||
|
'iki': 51,
|
||||||
|
'kat': 52,
|
||||||
|
'nch': 53,
|
||||||
|
' ka': 54,
|
||||||
|
' ki': 55,
|
||||||
|
'a b': 56,
|
||||||
|
'aji': 57,
|
||||||
|
'amb': 58,
|
||||||
|
'ra ': 59,
|
||||||
|
'ri ': 60,
|
||||||
|
'rik': 61,
|
||||||
|
'ada': 62,
|
||||||
|
'mat': 63,
|
||||||
|
'mba': 64,
|
||||||
|
'mes': 65,
|
||||||
|
'yo ': 66,
|
||||||
|
'zi ': 67,
|
||||||
|
'da ': 68,
|
||||||
|
'hi ': 69,
|
||||||
|
'i k': 70,
|
||||||
|
'ja ': 71,
|
||||||
|
'kut': 72,
|
||||||
|
'tek': 73,
|
||||||
|
'wan': 74,
|
||||||
|
' bi': 75,
|
||||||
|
'a a': 76,
|
||||||
|
'aka': 77,
|
||||||
|
'ao ': 78,
|
||||||
|
'asi': 79,
|
||||||
|
'cha': 80,
|
||||||
|
'ese': 81,
|
||||||
|
'eza': 82,
|
||||||
|
'ke ': 83,
|
||||||
|
'moj': 84,
|
||||||
|
'oja': 85,
|
||||||
|
' hi': 86,
|
||||||
|
'a z': 87,
|
||||||
|
'end': 88,
|
||||||
|
'ha ': 89,
|
||||||
|
'ji ': 90,
|
||||||
|
'mu ': 91,
|
||||||
|
'shi': 92,
|
||||||
|
'wat': 93,
|
||||||
|
' bw': 94,
|
||||||
|
'ake': 95,
|
||||||
|
'ara': 96,
|
||||||
|
'bw ': 97,
|
||||||
|
'i h': 98,
|
||||||
|
'imb': 99,
|
||||||
|
'tik': 100,
|
||||||
|
'wak': 101,
|
||||||
|
'wal': 102,
|
||||||
|
' hu': 103,
|
||||||
|
' mi': 104,
|
||||||
|
' mk': 105,
|
||||||
|
' ni': 106,
|
||||||
|
' ra': 107,
|
||||||
|
' um': 108,
|
||||||
|
'a l': 109,
|
||||||
|
'ate': 110,
|
||||||
|
'esh': 111,
|
||||||
|
'ina': 112,
|
||||||
|
'ish': 113,
|
||||||
|
'kim': 114,
|
||||||
|
'o k': 115,
|
||||||
|
' ir': 116,
|
||||||
|
'a i': 117,
|
||||||
|
'ala': 118,
|
||||||
|
'ani': 119,
|
||||||
|
'aq ': 120,
|
||||||
|
'azi': 121,
|
||||||
|
'hin': 122,
|
||||||
|
'i a': 123,
|
||||||
|
'idi': 124,
|
||||||
|
'ima': 125,
|
||||||
|
'ita': 126,
|
||||||
|
'rai': 127,
|
||||||
|
'raq': 128,
|
||||||
|
'sha': 129,
|
||||||
|
' ms': 130,
|
||||||
|
' se': 131,
|
||||||
|
'afr': 132,
|
||||||
|
'ama': 133,
|
||||||
|
'ano': 134,
|
||||||
|
'ea ': 135,
|
||||||
|
'ele': 136,
|
||||||
|
'fri': 137,
|
||||||
|
'go ': 138,
|
||||||
|
'i i': 139,
|
||||||
|
'ifa': 140,
|
||||||
|
'iwa': 141,
|
||||||
|
'iyo': 142,
|
||||||
|
'kus': 143,
|
||||||
|
'lia': 144,
|
||||||
|
'lio': 145,
|
||||||
|
'maj': 146,
|
||||||
|
'mku': 147,
|
||||||
|
'no ': 148,
|
||||||
|
'tan': 149,
|
||||||
|
'uli': 150,
|
||||||
|
'uta': 151,
|
||||||
|
'wen': 152,
|
||||||
|
' al': 153,
|
||||||
|
'a j': 154,
|
||||||
|
'aad': 155,
|
||||||
|
'aid': 156,
|
||||||
|
'ari': 157,
|
||||||
|
'awa': 158,
|
||||||
|
'ba ': 159,
|
||||||
|
'fa ': 160,
|
||||||
|
'nde': 161,
|
||||||
|
'nge': 162,
|
||||||
|
'nya': 163,
|
||||||
|
'o y': 164,
|
||||||
|
'u w': 165,
|
||||||
|
'ua ': 166,
|
||||||
|
'umo': 167,
|
||||||
|
'waz': 168,
|
||||||
|
'ye ': 169,
|
||||||
|
' ut': 170,
|
||||||
|
' vi': 171,
|
||||||
|
'a d': 172,
|
||||||
|
'a t': 173,
|
||||||
|
'aif': 174,
|
||||||
|
'di ': 175,
|
||||||
|
'ere': 176,
|
||||||
|
'ing': 177,
|
||||||
|
'kin': 178,
|
||||||
|
'nda': 179,
|
||||||
|
'o n': 180,
|
||||||
|
'oa ': 181,
|
||||||
|
'tai': 182,
|
||||||
|
'toa': 183,
|
||||||
|
'usa': 184,
|
||||||
|
'uto': 185,
|
||||||
|
'was': 186,
|
||||||
|
'yak': 187,
|
||||||
|
'zo ': 188,
|
||||||
|
' ji': 189,
|
||||||
|
' mw': 190,
|
||||||
|
'a p': 191,
|
||||||
|
'aia': 192,
|
||||||
|
'amu': 193,
|
||||||
|
'ang': 194,
|
||||||
|
'bik': 195,
|
||||||
|
'bo ': 196,
|
||||||
|
'del': 197,
|
||||||
|
'e w': 198,
|
||||||
|
'ene': 199,
|
||||||
|
'eng': 200,
|
||||||
|
'ich': 201,
|
||||||
|
'iri': 202,
|
||||||
|
'iti': 203,
|
||||||
|
'ito': 204,
|
||||||
|
'ki ': 205,
|
||||||
|
'kir': 206,
|
||||||
|
'ko ': 207,
|
||||||
|
'kuu': 208,
|
||||||
|
'mar': 209,
|
||||||
|
'mbo': 210,
|
||||||
|
'mil': 211,
|
||||||
|
'ngi': 212,
|
||||||
|
'ngo': 213,
|
||||||
|
'o l': 214,
|
||||||
|
'ong': 215,
|
||||||
|
'si ': 216,
|
||||||
|
'ta ': 217,
|
||||||
|
'tak': 218,
|
||||||
|
'u y': 219,
|
||||||
|
'umu': 220,
|
||||||
|
'usi': 221,
|
||||||
|
'uu ': 222,
|
||||||
|
'wam': 223,
|
||||||
|
' af': 224,
|
||||||
|
' ba': 225,
|
||||||
|
' li': 226,
|
||||||
|
' si': 227,
|
||||||
|
' zi': 228,
|
||||||
|
'a v': 229,
|
||||||
|
'ami': 230,
|
||||||
|
'atu': 231,
|
||||||
|
'awi': 232,
|
||||||
|
'eri': 233,
|
||||||
|
'fan': 234,
|
||||||
|
'fur': 235,
|
||||||
|
'ger': 236,
|
||||||
|
'i z': 237,
|
||||||
|
'isi': 238,
|
||||||
|
'izo': 239,
|
||||||
|
'lea': 240,
|
||||||
|
'mbi': 241,
|
||||||
|
'mwa': 242,
|
||||||
|
'nye': 243,
|
||||||
|
'o h': 244,
|
||||||
|
'o m': 245,
|
||||||
|
'oni': 246,
|
||||||
|
'rez': 247,
|
||||||
|
'saa': 248,
|
||||||
|
'ser': 249,
|
||||||
|
'sin': 250,
|
||||||
|
'tat': 251,
|
||||||
|
'tis': 252,
|
||||||
|
'tu ': 253,
|
||||||
|
'uin': 254,
|
||||||
|
'uki': 255,
|
||||||
|
'ur ': 256,
|
||||||
|
'wi ': 257,
|
||||||
|
'yar': 258,
|
||||||
|
' da': 259,
|
||||||
|
' en': 260,
|
||||||
|
' mp': 261,
|
||||||
|
' ny': 262,
|
||||||
|
' ta': 263,
|
||||||
|
' ul': 264,
|
||||||
|
' we': 265,
|
||||||
|
'a c': 266,
|
||||||
|
'a f': 267,
|
||||||
|
'ais': 268,
|
||||||
|
'apo': 269,
|
||||||
|
'ayo': 270,
|
||||||
|
'bar': 271,
|
||||||
|
'dhi': 272,
|
||||||
|
'e a': 273,
|
||||||
|
'eke': 274,
|
||||||
|
'eny': 275,
|
||||||
|
'eon': 276,
|
||||||
|
'hai': 277,
|
||||||
|
'han': 278,
|
||||||
|
'hiy': 279,
|
||||||
|
'hur': 280,
|
||||||
|
'i s': 281,
|
||||||
|
'imw': 282,
|
||||||
|
'kal': 283,
|
||||||
|
'kwe': 284,
|
||||||
|
'lak': 285,
|
||||||
|
'lam': 286,
|
||||||
|
'mak': 287,
|
||||||
|
'msa': 288,
|
||||||
|
'ne ': 289,
|
||||||
|
'ngu': 290,
|
||||||
|
'ru ': 291,
|
||||||
|
'sal': 292,
|
||||||
|
'swa': 293,
|
||||||
|
'te ': 294,
|
||||||
|
'ti ': 295,
|
||||||
|
'uku': 296,
|
||||||
|
'uma': 297,
|
||||||
|
'una': 298,
|
||||||
|
'uru': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/tl.py
Normal file
303
libs/guess_language/data/models/tl.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'ng ': 0,
|
||||||
|
'ang': 1,
|
||||||
|
' na': 2,
|
||||||
|
' sa': 3,
|
||||||
|
'an ': 4,
|
||||||
|
'nan': 5,
|
||||||
|
'sa ': 6,
|
||||||
|
'na ': 7,
|
||||||
|
' ma': 8,
|
||||||
|
' ca': 9,
|
||||||
|
'ay ': 10,
|
||||||
|
'n g': 11,
|
||||||
|
' an': 12,
|
||||||
|
'ong': 13,
|
||||||
|
' ga': 14,
|
||||||
|
'at ': 15,
|
||||||
|
' pa': 16,
|
||||||
|
'ala': 17,
|
||||||
|
' si': 18,
|
||||||
|
'a n': 19,
|
||||||
|
'ga ': 20,
|
||||||
|
'g n': 21,
|
||||||
|
'g m': 22,
|
||||||
|
'ito': 23,
|
||||||
|
'g c': 24,
|
||||||
|
'man': 25,
|
||||||
|
'san': 26,
|
||||||
|
'g s': 27,
|
||||||
|
'ing': 28,
|
||||||
|
'to ': 29,
|
||||||
|
'ila': 30,
|
||||||
|
'ina': 31,
|
||||||
|
' di': 32,
|
||||||
|
' ta': 33,
|
||||||
|
'aga': 34,
|
||||||
|
'iya': 35,
|
||||||
|
'aca': 36,
|
||||||
|
'g t': 37,
|
||||||
|
' at': 38,
|
||||||
|
'aya': 39,
|
||||||
|
'ama': 40,
|
||||||
|
'lan': 41,
|
||||||
|
'a a': 42,
|
||||||
|
'qui': 43,
|
||||||
|
'a c': 44,
|
||||||
|
'a s': 45,
|
||||||
|
'nag': 46,
|
||||||
|
' ba': 47,
|
||||||
|
'g i': 48,
|
||||||
|
'tan': 49,
|
||||||
|
"'t ": 50,
|
||||||
|
' cu': 51,
|
||||||
|
'aua': 52,
|
||||||
|
'g p': 53,
|
||||||
|
' ni': 54,
|
||||||
|
'os ': 55,
|
||||||
|
"'y ": 56,
|
||||||
|
'a m': 57,
|
||||||
|
' n ': 58,
|
||||||
|
'la ': 59,
|
||||||
|
' la': 60,
|
||||||
|
'o n': 61,
|
||||||
|
'yan': 62,
|
||||||
|
' ay': 63,
|
||||||
|
'usa': 64,
|
||||||
|
'cay': 65,
|
||||||
|
'on ': 66,
|
||||||
|
'ya ': 67,
|
||||||
|
' it': 68,
|
||||||
|
'al ': 69,
|
||||||
|
'apa': 70,
|
||||||
|
'ata': 71,
|
||||||
|
't n': 72,
|
||||||
|
'uan': 73,
|
||||||
|
'aha': 74,
|
||||||
|
'asa': 75,
|
||||||
|
'pag': 76,
|
||||||
|
' gu': 77,
|
||||||
|
'g l': 78,
|
||||||
|
'di ': 79,
|
||||||
|
'mag': 80,
|
||||||
|
'aba': 81,
|
||||||
|
'g a': 82,
|
||||||
|
'ara': 83,
|
||||||
|
'a p': 84,
|
||||||
|
'in ': 85,
|
||||||
|
'ana': 86,
|
||||||
|
'it ': 87,
|
||||||
|
'si ': 88,
|
||||||
|
'cus': 89,
|
||||||
|
'g b': 90,
|
||||||
|
'uin': 91,
|
||||||
|
'a t': 92,
|
||||||
|
'as ': 93,
|
||||||
|
'n n': 94,
|
||||||
|
'hin': 95,
|
||||||
|
' hi': 96,
|
||||||
|
"a't": 97,
|
||||||
|
'ali': 98,
|
||||||
|
' bu': 99,
|
||||||
|
'gan': 100,
|
||||||
|
'uma': 101,
|
||||||
|
'a d': 102,
|
||||||
|
'agc': 103,
|
||||||
|
'aqu': 104,
|
||||||
|
'g d': 105,
|
||||||
|
' tu': 106,
|
||||||
|
'aon': 107,
|
||||||
|
'ari': 108,
|
||||||
|
'cas': 109,
|
||||||
|
'i n': 110,
|
||||||
|
'niy': 111,
|
||||||
|
'pin': 112,
|
||||||
|
'a i': 113,
|
||||||
|
'gca': 114,
|
||||||
|
'siy': 115,
|
||||||
|
"a'y": 116,
|
||||||
|
'yao': 117,
|
||||||
|
'ag ': 118,
|
||||||
|
'ca ': 119,
|
||||||
|
'han': 120,
|
||||||
|
'ili': 121,
|
||||||
|
'pan': 122,
|
||||||
|
'sin': 123,
|
||||||
|
'ual': 124,
|
||||||
|
'n s': 125,
|
||||||
|
'nam': 126,
|
||||||
|
' lu': 127,
|
||||||
|
'can': 128,
|
||||||
|
'dit': 129,
|
||||||
|
'gui': 130,
|
||||||
|
'y n': 131,
|
||||||
|
'gal': 132,
|
||||||
|
'hat': 133,
|
||||||
|
'nal': 134,
|
||||||
|
' is': 135,
|
||||||
|
'bag': 136,
|
||||||
|
'fra': 137,
|
||||||
|
' fr': 138,
|
||||||
|
' su': 139,
|
||||||
|
'a l': 140,
|
||||||
|
' co': 141,
|
||||||
|
'ani': 142,
|
||||||
|
' bi': 143,
|
||||||
|
' da': 144,
|
||||||
|
'alo': 145,
|
||||||
|
'isa': 146,
|
||||||
|
'ita': 147,
|
||||||
|
'may': 148,
|
||||||
|
'o s': 149,
|
||||||
|
'sil': 150,
|
||||||
|
'una': 151,
|
||||||
|
' in': 152,
|
||||||
|
' pi': 153,
|
||||||
|
'l n': 154,
|
||||||
|
'nil': 155,
|
||||||
|
'o a': 156,
|
||||||
|
'pat': 157,
|
||||||
|
'sac': 158,
|
||||||
|
't s': 159,
|
||||||
|
' ua': 160,
|
||||||
|
'agu': 161,
|
||||||
|
'ail': 162,
|
||||||
|
'bin': 163,
|
||||||
|
'dal': 164,
|
||||||
|
'g h': 165,
|
||||||
|
'ndi': 166,
|
||||||
|
'oon': 167,
|
||||||
|
'ua ': 168,
|
||||||
|
' ha': 169,
|
||||||
|
'ind': 170,
|
||||||
|
'ran': 171,
|
||||||
|
's n': 172,
|
||||||
|
'tin': 173,
|
||||||
|
'ulo': 174,
|
||||||
|
'eng': 175,
|
||||||
|
'g f': 176,
|
||||||
|
'ini': 177,
|
||||||
|
'lah': 178,
|
||||||
|
'lo ': 179,
|
||||||
|
'rai': 180,
|
||||||
|
'rin': 181,
|
||||||
|
'ton': 182,
|
||||||
|
'g u': 183,
|
||||||
|
'inu': 184,
|
||||||
|
'lon': 185,
|
||||||
|
"o'y": 186,
|
||||||
|
't a': 187,
|
||||||
|
' ar': 188,
|
||||||
|
'a b': 189,
|
||||||
|
'ad ': 190,
|
||||||
|
'bay': 191,
|
||||||
|
'cal': 192,
|
||||||
|
'gya': 193,
|
||||||
|
'ile': 194,
|
||||||
|
'mat': 195,
|
||||||
|
'n a': 196,
|
||||||
|
'pau': 197,
|
||||||
|
'ra ': 198,
|
||||||
|
'tay': 199,
|
||||||
|
'y m': 200,
|
||||||
|
'ant': 201,
|
||||||
|
'ban': 202,
|
||||||
|
'i m': 203,
|
||||||
|
'nas': 204,
|
||||||
|
'nay': 205,
|
||||||
|
'no ': 206,
|
||||||
|
'sti': 207,
|
||||||
|
' ti': 208,
|
||||||
|
'ags': 209,
|
||||||
|
'g g': 210,
|
||||||
|
'ta ': 211,
|
||||||
|
'uit': 212,
|
||||||
|
'uno': 213,
|
||||||
|
' ib': 214,
|
||||||
|
' ya': 215,
|
||||||
|
'a u': 216,
|
||||||
|
'abi': 217,
|
||||||
|
'ati': 218,
|
||||||
|
'cap': 219,
|
||||||
|
'ig ': 220,
|
||||||
|
'is ': 221,
|
||||||
|
"la'": 222,
|
||||||
|
' do': 223,
|
||||||
|
' pu': 224,
|
||||||
|
'api': 225,
|
||||||
|
'ayo': 226,
|
||||||
|
'gos': 227,
|
||||||
|
'gul': 228,
|
||||||
|
'lal': 229,
|
||||||
|
'tag': 230,
|
||||||
|
'til': 231,
|
||||||
|
'tun': 232,
|
||||||
|
'y c': 233,
|
||||||
|
'y s': 234,
|
||||||
|
'yon': 235,
|
||||||
|
'ano': 236,
|
||||||
|
'bur': 237,
|
||||||
|
'iba': 238,
|
||||||
|
'isi': 239,
|
||||||
|
'lam': 240,
|
||||||
|
'nac': 241,
|
||||||
|
'nat': 242,
|
||||||
|
'ni ': 243,
|
||||||
|
'nto': 244,
|
||||||
|
'od ': 245,
|
||||||
|
'pa ': 246,
|
||||||
|
'rgo': 247,
|
||||||
|
'urg': 248,
|
||||||
|
' m ': 249,
|
||||||
|
'adr': 250,
|
||||||
|
'ast': 251,
|
||||||
|
'cag': 252,
|
||||||
|
'gay': 253,
|
||||||
|
'gsi': 254,
|
||||||
|
'i p': 255,
|
||||||
|
'ino': 256,
|
||||||
|
'len': 257,
|
||||||
|
'lin': 258,
|
||||||
|
'm g': 259,
|
||||||
|
'mar': 260,
|
||||||
|
'nah': 261,
|
||||||
|
"to'": 262,
|
||||||
|
' de': 263,
|
||||||
|
'a h': 264,
|
||||||
|
'cat': 265,
|
||||||
|
'cau': 266,
|
||||||
|
'con': 267,
|
||||||
|
'iqu': 268,
|
||||||
|
'lac': 269,
|
||||||
|
'mab': 270,
|
||||||
|
'min': 271,
|
||||||
|
'og ': 272,
|
||||||
|
'par': 273,
|
||||||
|
'sal': 274,
|
||||||
|
' za': 275,
|
||||||
|
'ao ': 276,
|
||||||
|
'doo': 277,
|
||||||
|
'ipi': 278,
|
||||||
|
'nod': 279,
|
||||||
|
'nte': 280,
|
||||||
|
'uha': 281,
|
||||||
|
'ula': 282,
|
||||||
|
' re': 283,
|
||||||
|
'ill': 284,
|
||||||
|
'lit': 285,
|
||||||
|
'mac': 286,
|
||||||
|
'nit': 287,
|
||||||
|
"o't": 288,
|
||||||
|
'or ': 289,
|
||||||
|
'ora': 290,
|
||||||
|
'sum': 291,
|
||||||
|
'y p': 292,
|
||||||
|
' al': 293,
|
||||||
|
' mi': 294,
|
||||||
|
' um': 295,
|
||||||
|
'aco': 296,
|
||||||
|
'ada': 297,
|
||||||
|
'agd': 298,
|
||||||
|
'cab': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/tlh.py
Normal file
303
libs/guess_language/data/models/tlh.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'tlh': 0,
|
||||||
|
"e' ": 1,
|
||||||
|
'gh ': 2,
|
||||||
|
"i' ": 3,
|
||||||
|
" 'e": 4,
|
||||||
|
"u' ": 5,
|
||||||
|
' vi': 6,
|
||||||
|
'atl': 7,
|
||||||
|
"a' ": 8,
|
||||||
|
' gh': 9,
|
||||||
|
'ej ': 10,
|
||||||
|
' ho': 11,
|
||||||
|
' ch': 12,
|
||||||
|
' mu': 13,
|
||||||
|
' tl': 14,
|
||||||
|
'nga': 15,
|
||||||
|
'mey': 16,
|
||||||
|
"wi'": 17,
|
||||||
|
"be'": 18,
|
||||||
|
'an ': 19,
|
||||||
|
'ch ': 20,
|
||||||
|
'gan': 21,
|
||||||
|
'chu': 22,
|
||||||
|
'lh ': 23,
|
||||||
|
'ing': 24,
|
||||||
|
"'e'": 25,
|
||||||
|
'hin': 26,
|
||||||
|
'jat': 27,
|
||||||
|
'lhi': 28,
|
||||||
|
' da': 29,
|
||||||
|
' ja': 30,
|
||||||
|
"o' ": 31,
|
||||||
|
'ugh': 32,
|
||||||
|
'aq ': 33,
|
||||||
|
'cha': 34,
|
||||||
|
' po': 35,
|
||||||
|
'ey ': 36,
|
||||||
|
" 'a": 37,
|
||||||
|
' je': 38,
|
||||||
|
"'ej": 39,
|
||||||
|
' pa': 40,
|
||||||
|
'ng ': 41,
|
||||||
|
'ad ': 42,
|
||||||
|
' qa': 43,
|
||||||
|
'oh ': 44,
|
||||||
|
'eh ': 45,
|
||||||
|
'ah ': 46,
|
||||||
|
'gha': 47,
|
||||||
|
'je ': 48,
|
||||||
|
' lu': 49,
|
||||||
|
'hol': 50,
|
||||||
|
"aw'": 51,
|
||||||
|
' ji': 52,
|
||||||
|
'ong': 53,
|
||||||
|
"pu'": 54,
|
||||||
|
'aj ': 55,
|
||||||
|
'vad': 56,
|
||||||
|
"w' ": 57,
|
||||||
|
"' j": 58,
|
||||||
|
"ha'": 59,
|
||||||
|
'is ': 60,
|
||||||
|
'tah': 61,
|
||||||
|
"' '": 62,
|
||||||
|
'ang': 63,
|
||||||
|
"h '": 64,
|
||||||
|
'pon': 65,
|
||||||
|
'am ': 66,
|
||||||
|
'law': 67,
|
||||||
|
"mo'": 68,
|
||||||
|
"qu'": 69,
|
||||||
|
'hbe': 70,
|
||||||
|
'ol ': 71,
|
||||||
|
'vam': 72,
|
||||||
|
'agh': 73,
|
||||||
|
"mu'": 74,
|
||||||
|
'ahv': 75,
|
||||||
|
'bej': 76,
|
||||||
|
'ogh': 77,
|
||||||
|
'uch': 78,
|
||||||
|
"' v": 79,
|
||||||
|
'ach': 80,
|
||||||
|
'hug': 81,
|
||||||
|
' lo': 82,
|
||||||
|
' qu': 83,
|
||||||
|
'cho': 84,
|
||||||
|
'hva': 85,
|
||||||
|
'ij ': 86,
|
||||||
|
' la': 87,
|
||||||
|
"lu'": 88,
|
||||||
|
'vis': 89,
|
||||||
|
' ne': 90,
|
||||||
|
' pu': 91,
|
||||||
|
' so': 92,
|
||||||
|
' ta': 93,
|
||||||
|
' va': 94,
|
||||||
|
"'ac": 95,
|
||||||
|
"di'": 96,
|
||||||
|
"hu'": 97,
|
||||||
|
'lah': 98,
|
||||||
|
'moh': 99,
|
||||||
|
" 'o": 100,
|
||||||
|
"' m": 101,
|
||||||
|
'daq': 102,
|
||||||
|
'hah': 103,
|
||||||
|
'n h': 104,
|
||||||
|
'neh': 105,
|
||||||
|
"u'm": 106,
|
||||||
|
"ay'": 107,
|
||||||
|
'gho': 108,
|
||||||
|
'h v': 109,
|
||||||
|
'meh': 110,
|
||||||
|
'oy ': 111,
|
||||||
|
' ma': 112,
|
||||||
|
' nu': 113,
|
||||||
|
"'me": 114,
|
||||||
|
'el ': 115,
|
||||||
|
' ba': 116,
|
||||||
|
' be': 117,
|
||||||
|
' de': 118,
|
||||||
|
' ng': 119,
|
||||||
|
"' t": 120,
|
||||||
|
'h d': 121,
|
||||||
|
'hvi': 122,
|
||||||
|
'oq ': 123,
|
||||||
|
' wa': 124,
|
||||||
|
"' l": 125,
|
||||||
|
"'wi": 126,
|
||||||
|
'hme': 127,
|
||||||
|
"li'": 128,
|
||||||
|
'uq ': 129,
|
||||||
|
' bo': 130,
|
||||||
|
'bog': 131,
|
||||||
|
'del': 132,
|
||||||
|
'h p': 133,
|
||||||
|
'h t': 134,
|
||||||
|
'ich': 135,
|
||||||
|
'vil': 136,
|
||||||
|
' qe': 137,
|
||||||
|
' wi': 138,
|
||||||
|
'ahb': 139,
|
||||||
|
'ban': 140,
|
||||||
|
'eng': 141,
|
||||||
|
'haq': 142,
|
||||||
|
'hoh': 143,
|
||||||
|
'ov ': 144,
|
||||||
|
'viq': 145,
|
||||||
|
' ha': 146,
|
||||||
|
' ti': 147,
|
||||||
|
"' n": 148,
|
||||||
|
"' p": 149,
|
||||||
|
"'a'": 150,
|
||||||
|
'hwi': 151,
|
||||||
|
'igh': 152,
|
||||||
|
"lo'": 153,
|
||||||
|
"y' ": 154,
|
||||||
|
' du': 155,
|
||||||
|
' no': 156,
|
||||||
|
' yu': 157,
|
||||||
|
"'mo": 158,
|
||||||
|
"'va": 159,
|
||||||
|
'daj': 160,
|
||||||
|
'das': 161,
|
||||||
|
'egh': 162,
|
||||||
|
'hom': 163,
|
||||||
|
'muc': 164,
|
||||||
|
'om ': 165,
|
||||||
|
'otl': 166,
|
||||||
|
'us ': 167,
|
||||||
|
' bi': 168,
|
||||||
|
' tu': 169,
|
||||||
|
"' h": 170,
|
||||||
|
'chm': 171,
|
||||||
|
'h q': 172,
|
||||||
|
'hov': 173,
|
||||||
|
'nis': 174,
|
||||||
|
'qar': 175,
|
||||||
|
'uj ': 176,
|
||||||
|
"' q": 177,
|
||||||
|
"'ch": 178,
|
||||||
|
'h m': 179,
|
||||||
|
'hmo': 180,
|
||||||
|
'jih': 181,
|
||||||
|
'par': 182,
|
||||||
|
'wij': 183,
|
||||||
|
' hu': 184,
|
||||||
|
"' d": 185,
|
||||||
|
"'a ": 186,
|
||||||
|
'etl': 187,
|
||||||
|
'h g': 188,
|
||||||
|
'h j': 189,
|
||||||
|
'h l': 190,
|
||||||
|
'lod': 191,
|
||||||
|
'maq': 192,
|
||||||
|
'och': 193,
|
||||||
|
"wa'": 194,
|
||||||
|
'yuq': 195,
|
||||||
|
' di': 196,
|
||||||
|
' le': 197,
|
||||||
|
' pe': 198,
|
||||||
|
' ya': 199,
|
||||||
|
"'di": 200,
|
||||||
|
'che': 201,
|
||||||
|
'ech': 202,
|
||||||
|
'ih ': 203,
|
||||||
|
'ija': 204,
|
||||||
|
'in ': 205,
|
||||||
|
"j '": 206,
|
||||||
|
'j m': 207,
|
||||||
|
'lhw': 208,
|
||||||
|
"pa'": 209,
|
||||||
|
" 'i": 210,
|
||||||
|
' mi': 211,
|
||||||
|
' qi': 212,
|
||||||
|
' ro': 213,
|
||||||
|
' ru': 214,
|
||||||
|
"'be": 215,
|
||||||
|
'anp': 216,
|
||||||
|
'ghi': 217,
|
||||||
|
'ghu': 218,
|
||||||
|
'h b': 219,
|
||||||
|
'hay': 220,
|
||||||
|
'hch': 221,
|
||||||
|
'iq ': 222,
|
||||||
|
'npu': 223,
|
||||||
|
'od ': 224,
|
||||||
|
'paq': 225,
|
||||||
|
'qay': 226,
|
||||||
|
'rda': 227,
|
||||||
|
'soh': 228,
|
||||||
|
' do': 229,
|
||||||
|
' me': 230,
|
||||||
|
' qo': 231,
|
||||||
|
' sa': 232,
|
||||||
|
"' c": 233,
|
||||||
|
"' g": 234,
|
||||||
|
"' s": 235,
|
||||||
|
"'lu": 236,
|
||||||
|
'aml': 237,
|
||||||
|
'ard': 238,
|
||||||
|
'as ': 239,
|
||||||
|
'd p': 240,
|
||||||
|
'gme': 241,
|
||||||
|
'h n': 242,
|
||||||
|
'hta': 243,
|
||||||
|
"i'v": 244,
|
||||||
|
'j j': 245,
|
||||||
|
'jij': 246,
|
||||||
|
'len': 247,
|
||||||
|
'ngm': 248,
|
||||||
|
'qan': 249,
|
||||||
|
'qme': 250,
|
||||||
|
'vaj': 251,
|
||||||
|
'wiv': 252,
|
||||||
|
' mo': 253,
|
||||||
|
' ni': 254,
|
||||||
|
"'la": 255,
|
||||||
|
"'pu": 256,
|
||||||
|
"'qu": 257,
|
||||||
|
'ar ': 258,
|
||||||
|
'arm': 259,
|
||||||
|
'dwi': 260,
|
||||||
|
'g p': 261,
|
||||||
|
'ghd': 262,
|
||||||
|
'h c': 263,
|
||||||
|
'ham': 264,
|
||||||
|
'hla': 265,
|
||||||
|
'hqu': 266,
|
||||||
|
'ilo': 267,
|
||||||
|
'iqa': 268,
|
||||||
|
'iqi': 269,
|
||||||
|
'j p': 270,
|
||||||
|
'j t': 271,
|
||||||
|
'j v': 272,
|
||||||
|
'lad': 273,
|
||||||
|
'lho': 274,
|
||||||
|
'mar': 275,
|
||||||
|
'mug': 276,
|
||||||
|
'pus': 277,
|
||||||
|
'q s': 278,
|
||||||
|
'q t': 279,
|
||||||
|
'rgh': 280,
|
||||||
|
'rma': 281,
|
||||||
|
'sov': 282,
|
||||||
|
"ta'": 283,
|
||||||
|
'tin': 284,
|
||||||
|
"tu'": 285,
|
||||||
|
"u'd": 286,
|
||||||
|
'vet': 287,
|
||||||
|
'yli': 288,
|
||||||
|
"yu'": 289,
|
||||||
|
' to': 290,
|
||||||
|
"'oh": 291,
|
||||||
|
'aqq': 292,
|
||||||
|
'art': 293,
|
||||||
|
'at ': 294,
|
||||||
|
'ayl': 295,
|
||||||
|
'ayt': 296,
|
||||||
|
'et ': 297,
|
||||||
|
'haj': 298,
|
||||||
|
'har': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/tn.py
Normal file
303
libs/guess_language/data/models/tn.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
' di': 0,
|
||||||
|
' le': 1,
|
||||||
|
'go ': 2,
|
||||||
|
'le ': 3,
|
||||||
|
' go': 4,
|
||||||
|
'ng ': 5,
|
||||||
|
' ts': 6,
|
||||||
|
'ya ': 7,
|
||||||
|
' ya': 8,
|
||||||
|
'sa ': 9,
|
||||||
|
'tlh': 10,
|
||||||
|
' mo': 11,
|
||||||
|
' bo': 12,
|
||||||
|
'a m': 13,
|
||||||
|
'lo ': 14,
|
||||||
|
'tsa': 15,
|
||||||
|
' e ': 16,
|
||||||
|
'o t': 17,
|
||||||
|
'a b': 18,
|
||||||
|
'wa ': 19,
|
||||||
|
' ka': 20,
|
||||||
|
'a k': 21,
|
||||||
|
'a t': 22,
|
||||||
|
'ka ': 23,
|
||||||
|
'a g': 24,
|
||||||
|
'eng': 25,
|
||||||
|
'olo': 26,
|
||||||
|
'o y': 27,
|
||||||
|
'la ': 28,
|
||||||
|
' a ': 29,
|
||||||
|
'a d': 30,
|
||||||
|
'ets': 31,
|
||||||
|
'mo ': 32,
|
||||||
|
'se ': 33,
|
||||||
|
' tl': 34,
|
||||||
|
' ba': 35,
|
||||||
|
'tsh': 36,
|
||||||
|
' ma': 37,
|
||||||
|
'ba ': 38,
|
||||||
|
'a l': 39,
|
||||||
|
'tse': 40,
|
||||||
|
'so ': 41,
|
||||||
|
'na ': 42,
|
||||||
|
'elo': 43,
|
||||||
|
' se': 44,
|
||||||
|
'ele': 45,
|
||||||
|
'e d': 46,
|
||||||
|
'o l': 47,
|
||||||
|
'lho': 48,
|
||||||
|
'e t': 49,
|
||||||
|
'di ': 50,
|
||||||
|
'e g': 51,
|
||||||
|
' kg': 52,
|
||||||
|
'dit': 53,
|
||||||
|
'kgo': 54,
|
||||||
|
'o k': 55,
|
||||||
|
'ang': 56,
|
||||||
|
'lha': 57,
|
||||||
|
'e m': 58,
|
||||||
|
'e e': 59,
|
||||||
|
'we ': 60,
|
||||||
|
'ane': 61,
|
||||||
|
'o m': 62,
|
||||||
|
'e k': 63,
|
||||||
|
'e l': 64,
|
||||||
|
'ong': 65,
|
||||||
|
'set': 66,
|
||||||
|
'wan': 67,
|
||||||
|
'ela': 68,
|
||||||
|
'tso': 69,
|
||||||
|
'tla': 70,
|
||||||
|
'o d': 71,
|
||||||
|
'e b': 72,
|
||||||
|
'ola': 73,
|
||||||
|
'ngw': 74,
|
||||||
|
'gwe': 75,
|
||||||
|
'o b': 76,
|
||||||
|
'aba': 77,
|
||||||
|
'atl': 78,
|
||||||
|
'a p': 79,
|
||||||
|
' o ': 80,
|
||||||
|
'a a': 81,
|
||||||
|
'o a': 82,
|
||||||
|
'otl': 83,
|
||||||
|
'a s': 84,
|
||||||
|
'o e': 85,
|
||||||
|
'dir': 86,
|
||||||
|
'thu': 87,
|
||||||
|
'ga ': 88,
|
||||||
|
' ga': 89,
|
||||||
|
'shw': 90,
|
||||||
|
'ots': 91,
|
||||||
|
'aka': 92,
|
||||||
|
'hab': 93,
|
||||||
|
'hwa': 94,
|
||||||
|
'aga': 95,
|
||||||
|
'o g': 96,
|
||||||
|
'gan': 97,
|
||||||
|
'tsw': 98,
|
||||||
|
'ana': 99,
|
||||||
|
'mol': 100,
|
||||||
|
' ke': 101,
|
||||||
|
'hut': 102,
|
||||||
|
' me': 103,
|
||||||
|
'ona': 104,
|
||||||
|
'lel': 105,
|
||||||
|
'its': 106,
|
||||||
|
'lao': 107,
|
||||||
|
'kga': 108,
|
||||||
|
'dik': 109,
|
||||||
|
'got': 110,
|
||||||
|
' fa': 111,
|
||||||
|
'let': 112,
|
||||||
|
' wa': 113,
|
||||||
|
'ose': 114,
|
||||||
|
'no ': 115,
|
||||||
|
't h': 116,
|
||||||
|
'swe': 117,
|
||||||
|
'edi': 118,
|
||||||
|
'ats': 119,
|
||||||
|
'a n': 120,
|
||||||
|
'e s': 121,
|
||||||
|
'oko': 122,
|
||||||
|
'oth': 123,
|
||||||
|
'kwa': 124,
|
||||||
|
'kar': 125,
|
||||||
|
' th': 126,
|
||||||
|
'a e': 127,
|
||||||
|
'ala': 128,
|
||||||
|
'tir': 129,
|
||||||
|
'o n': 130,
|
||||||
|
'dip': 131,
|
||||||
|
'isa': 132,
|
||||||
|
'gat': 133,
|
||||||
|
'ti ': 134,
|
||||||
|
'ano': 135,
|
||||||
|
'bot': 136,
|
||||||
|
' nn': 137,
|
||||||
|
' ha': 138,
|
||||||
|
'len': 139,
|
||||||
|
'alo': 140,
|
||||||
|
'any': 141,
|
||||||
|
'aro': 142,
|
||||||
|
'iti': 143,
|
||||||
|
'iri': 144,
|
||||||
|
'o s': 145,
|
||||||
|
'sen': 146,
|
||||||
|
'net': 147,
|
||||||
|
'ke ': 148,
|
||||||
|
'ho ': 149,
|
||||||
|
'mai': 150,
|
||||||
|
'ika': 151,
|
||||||
|
'eka': 152,
|
||||||
|
'to ': 153,
|
||||||
|
'ith': 154,
|
||||||
|
're ': 155,
|
||||||
|
'g m': 156,
|
||||||
|
'hat': 157,
|
||||||
|
'bo ': 158,
|
||||||
|
'g l': 159,
|
||||||
|
'et ': 160,
|
||||||
|
'emo': 161,
|
||||||
|
'ama': 162,
|
||||||
|
'iso': 163,
|
||||||
|
'rol': 164,
|
||||||
|
'fa ': 165,
|
||||||
|
'iwa': 166,
|
||||||
|
'kan': 167,
|
||||||
|
'she': 168,
|
||||||
|
'si ': 169,
|
||||||
|
'ao ': 170,
|
||||||
|
'g k': 171,
|
||||||
|
'wen': 172,
|
||||||
|
'lol': 173,
|
||||||
|
'o o': 174,
|
||||||
|
'bos': 175,
|
||||||
|
'itl': 176,
|
||||||
|
'a y': 177,
|
||||||
|
'the': 178,
|
||||||
|
'lwa': 179,
|
||||||
|
'e n': 180,
|
||||||
|
' la': 181,
|
||||||
|
'ore': 182,
|
||||||
|
' mm': 183,
|
||||||
|
'ko ': 184,
|
||||||
|
'tha': 185,
|
||||||
|
'e a': 186,
|
||||||
|
'eo ': 187,
|
||||||
|
'lhe': 188,
|
||||||
|
'bol': 189,
|
||||||
|
'ha ': 190,
|
||||||
|
' po': 191,
|
||||||
|
'isi': 192,
|
||||||
|
'i b': 193,
|
||||||
|
'lan': 194,
|
||||||
|
' na': 195,
|
||||||
|
'i t': 196,
|
||||||
|
'ale': 197,
|
||||||
|
'ne ': 198,
|
||||||
|
'gon': 199,
|
||||||
|
'ris': 200,
|
||||||
|
'ira': 201,
|
||||||
|
'bon': 202,
|
||||||
|
' sa': 203,
|
||||||
|
'g y': 204,
|
||||||
|
'g g': 205,
|
||||||
|
'pha': 206,
|
||||||
|
'oga': 207,
|
||||||
|
'mel': 208,
|
||||||
|
'ro ': 209,
|
||||||
|
'gol': 210,
|
||||||
|
'o w': 211,
|
||||||
|
' kw': 212,
|
||||||
|
'i l': 213,
|
||||||
|
' ti': 214,
|
||||||
|
'tlo': 215,
|
||||||
|
'log': 216,
|
||||||
|
'por': 217,
|
||||||
|
' ja': 218,
|
||||||
|
'a f': 219,
|
||||||
|
' ne': 220,
|
||||||
|
'hok': 221,
|
||||||
|
'lot': 222,
|
||||||
|
' pu': 223,
|
||||||
|
'e y': 224,
|
||||||
|
'uto': 225,
|
||||||
|
'g t': 226,
|
||||||
|
'hom': 227,
|
||||||
|
'okg': 228,
|
||||||
|
' ko': 229,
|
||||||
|
'o f': 230,
|
||||||
|
'ame': 231,
|
||||||
|
'gor': 232,
|
||||||
|
'ta ': 233,
|
||||||
|
' pe': 234,
|
||||||
|
'nts': 235,
|
||||||
|
' kh': 236,
|
||||||
|
'tho': 237,
|
||||||
|
'gel': 238,
|
||||||
|
'adi': 239,
|
||||||
|
'are': 240,
|
||||||
|
'ete': 241,
|
||||||
|
'ase': 242,
|
||||||
|
'mon': 243,
|
||||||
|
'heo': 244,
|
||||||
|
'oro': 245,
|
||||||
|
'omo': 246,
|
||||||
|
'nen': 247,
|
||||||
|
'nel': 248,
|
||||||
|
'ile': 249,
|
||||||
|
'nng': 250,
|
||||||
|
'ntl': 251,
|
||||||
|
'abo': 252,
|
||||||
|
'ogo': 253,
|
||||||
|
'ara': 254,
|
||||||
|
'nse': 255,
|
||||||
|
'ego': 256,
|
||||||
|
'hel': 257,
|
||||||
|
'uo ': 258,
|
||||||
|
'mog': 259,
|
||||||
|
'san': 260,
|
||||||
|
'ula': 261,
|
||||||
|
'rag': 262,
|
||||||
|
'kol': 263,
|
||||||
|
'te ': 264,
|
||||||
|
'etl': 265,
|
||||||
|
'bat': 266,
|
||||||
|
' te': 267,
|
||||||
|
'puo': 268,
|
||||||
|
'amo': 269,
|
||||||
|
'ofe': 270,
|
||||||
|
'lat': 271,
|
||||||
|
'ati': 272,
|
||||||
|
'ole': 273,
|
||||||
|
'rab': 274,
|
||||||
|
'tsi': 275,
|
||||||
|
'iro': 276,
|
||||||
|
'man': 277,
|
||||||
|
'ael': 278,
|
||||||
|
'ega': 279,
|
||||||
|
'lwe': 280,
|
||||||
|
'ra ': 281,
|
||||||
|
'din': 282,
|
||||||
|
'tle': 283,
|
||||||
|
'sek': 284,
|
||||||
|
'ing': 285,
|
||||||
|
'yo ': 286,
|
||||||
|
'a o': 287,
|
||||||
|
' re': 288,
|
||||||
|
'aot': 289,
|
||||||
|
'uso': 290,
|
||||||
|
'o r': 291,
|
||||||
|
'ere': 292,
|
||||||
|
'jwa': 293,
|
||||||
|
'aem': 294,
|
||||||
|
'lam': 295,
|
||||||
|
'lek': 296,
|
||||||
|
' jw': 297,
|
||||||
|
'gwa': 298,
|
||||||
|
'mok': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/tr.py
Normal file
303
libs/guess_language/data/models/tr.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'lar': 0,
|
||||||
|
'en ': 1,
|
||||||
|
'ler': 2,
|
||||||
|
'an ': 3,
|
||||||
|
'in ': 4,
|
||||||
|
' bi': 5,
|
||||||
|
' ya': 6,
|
||||||
|
'eri': 7,
|
||||||
|
'de ': 8,
|
||||||
|
' ka': 9,
|
||||||
|
'ir ': 10,
|
||||||
|
'arı': 11,
|
||||||
|
' ba': 12,
|
||||||
|
' de': 13,
|
||||||
|
' ha': 14,
|
||||||
|
'ın ': 15,
|
||||||
|
'ara': 16,
|
||||||
|
'bir': 17,
|
||||||
|
' ve': 18,
|
||||||
|
' sa': 19,
|
||||||
|
'ile': 20,
|
||||||
|
'le ': 21,
|
||||||
|
'nde': 22,
|
||||||
|
'da ': 23,
|
||||||
|
' bu': 24,
|
||||||
|
'ana': 25,
|
||||||
|
'ini': 26,
|
||||||
|
'ını': 27,
|
||||||
|
'er ': 28,
|
||||||
|
've ': 29,
|
||||||
|
' yı': 30,
|
||||||
|
'lma': 31,
|
||||||
|
'yıl': 32,
|
||||||
|
' ol': 33,
|
||||||
|
'ar ': 34,
|
||||||
|
'n b': 35,
|
||||||
|
'nda': 36,
|
||||||
|
'aya': 37,
|
||||||
|
'li ': 38,
|
||||||
|
'ası': 39,
|
||||||
|
' ge': 40,
|
||||||
|
'ind': 41,
|
||||||
|
'n k': 42,
|
||||||
|
'esi': 43,
|
||||||
|
'lan': 44,
|
||||||
|
'nla': 45,
|
||||||
|
'ak ': 46,
|
||||||
|
'anı': 47,
|
||||||
|
'eni': 48,
|
||||||
|
'ni ': 49,
|
||||||
|
'nı ': 50,
|
||||||
|
'rın': 51,
|
||||||
|
'san': 52,
|
||||||
|
' ko': 53,
|
||||||
|
' ye': 54,
|
||||||
|
'maz': 55,
|
||||||
|
'baş': 56,
|
||||||
|
'ili': 57,
|
||||||
|
'rin': 58,
|
||||||
|
'alı': 59,
|
||||||
|
'az ': 60,
|
||||||
|
'hal': 61,
|
||||||
|
'ınd': 62,
|
||||||
|
' da': 63,
|
||||||
|
' gü': 64,
|
||||||
|
'ele': 65,
|
||||||
|
'ılm': 66,
|
||||||
|
'ığı': 67,
|
||||||
|
'eki': 68,
|
||||||
|
'gün': 69,
|
||||||
|
'i b': 70,
|
||||||
|
'içi': 71,
|
||||||
|
'den': 72,
|
||||||
|
'kar': 73,
|
||||||
|
'si ': 74,
|
||||||
|
' il': 75,
|
||||||
|
'e y': 76,
|
||||||
|
'na ': 77,
|
||||||
|
'yor': 78,
|
||||||
|
'ek ': 79,
|
||||||
|
'n s': 80,
|
||||||
|
' iç': 81,
|
||||||
|
'bu ': 82,
|
||||||
|
'e b': 83,
|
||||||
|
'im ': 84,
|
||||||
|
'ki ': 85,
|
||||||
|
'len': 86,
|
||||||
|
'ri ': 87,
|
||||||
|
'sın': 88,
|
||||||
|
' so': 89,
|
||||||
|
'ün ': 90,
|
||||||
|
' ta': 91,
|
||||||
|
'nin': 92,
|
||||||
|
'iği': 93,
|
||||||
|
'tan': 94,
|
||||||
|
'yan': 95,
|
||||||
|
' si': 96,
|
||||||
|
'nat': 97,
|
||||||
|
'nın': 98,
|
||||||
|
'kan': 99,
|
||||||
|
'rı ': 100,
|
||||||
|
'çin': 101,
|
||||||
|
'ğı ': 102,
|
||||||
|
'eli': 103,
|
||||||
|
'n a': 104,
|
||||||
|
'ır ': 105,
|
||||||
|
' an': 106,
|
||||||
|
'ine': 107,
|
||||||
|
'n y': 108,
|
||||||
|
'ola': 109,
|
||||||
|
' ar': 110,
|
||||||
|
'al ': 111,
|
||||||
|
'e s': 112,
|
||||||
|
'lik': 113,
|
||||||
|
'n d': 114,
|
||||||
|
'sin': 115,
|
||||||
|
' al': 116,
|
||||||
|
' dü': 117,
|
||||||
|
'anl': 118,
|
||||||
|
'ne ': 119,
|
||||||
|
'ya ': 120,
|
||||||
|
'ım ': 121,
|
||||||
|
'ına': 122,
|
||||||
|
' be': 123,
|
||||||
|
'ada': 124,
|
||||||
|
'ala': 125,
|
||||||
|
'ama': 126,
|
||||||
|
'ilm': 127,
|
||||||
|
'or ': 128,
|
||||||
|
'sı ': 129,
|
||||||
|
'yen': 130,
|
||||||
|
' me': 131,
|
||||||
|
'atı': 132,
|
||||||
|
'di ': 133,
|
||||||
|
'eti': 134,
|
||||||
|
'ken': 135,
|
||||||
|
'la ': 136,
|
||||||
|
'lı ': 137,
|
||||||
|
'oru': 138,
|
||||||
|
' gö': 139,
|
||||||
|
' in': 140,
|
||||||
|
'and': 141,
|
||||||
|
'e d': 142,
|
||||||
|
'men': 143,
|
||||||
|
'un ': 144,
|
||||||
|
'öne': 145,
|
||||||
|
'a d': 146,
|
||||||
|
'at ': 147,
|
||||||
|
'e a': 148,
|
||||||
|
'e g': 149,
|
||||||
|
'yar': 150,
|
||||||
|
' ku': 151,
|
||||||
|
'ayı': 152,
|
||||||
|
'dan': 153,
|
||||||
|
'edi': 154,
|
||||||
|
'iri': 155,
|
||||||
|
'ünü': 156,
|
||||||
|
'ği ': 157,
|
||||||
|
'ılı': 158,
|
||||||
|
'eme': 159,
|
||||||
|
'eği': 160,
|
||||||
|
'i k': 161,
|
||||||
|
'i y': 162,
|
||||||
|
'ıla': 163,
|
||||||
|
' ça': 164,
|
||||||
|
'a y': 165,
|
||||||
|
'alk': 166,
|
||||||
|
'dı ': 167,
|
||||||
|
'ede': 168,
|
||||||
|
'el ': 169,
|
||||||
|
'ndı': 170,
|
||||||
|
'ra ': 171,
|
||||||
|
'üne': 172,
|
||||||
|
' sü': 173,
|
||||||
|
'dır': 174,
|
||||||
|
'e k': 175,
|
||||||
|
'ere': 176,
|
||||||
|
'ik ': 177,
|
||||||
|
'imi': 178,
|
||||||
|
'işi': 179,
|
||||||
|
'mas': 180,
|
||||||
|
'n h': 181,
|
||||||
|
'sür': 182,
|
||||||
|
'yle': 183,
|
||||||
|
' ad': 184,
|
||||||
|
' fi': 185,
|
||||||
|
' gi': 186,
|
||||||
|
' se': 187,
|
||||||
|
'a k': 188,
|
||||||
|
'arl': 189,
|
||||||
|
'aşı': 190,
|
||||||
|
'iyo': 191,
|
||||||
|
'kla': 192,
|
||||||
|
'lığ': 193,
|
||||||
|
'nem': 194,
|
||||||
|
'ney': 195,
|
||||||
|
'rme': 196,
|
||||||
|
'ste': 197,
|
||||||
|
'tı ': 198,
|
||||||
|
'unl': 199,
|
||||||
|
'ver': 200,
|
||||||
|
' sı': 201,
|
||||||
|
' te': 202,
|
||||||
|
' to': 203,
|
||||||
|
'a s': 204,
|
||||||
|
'aşk': 205,
|
||||||
|
'ekl': 206,
|
||||||
|
'end': 207,
|
||||||
|
'kal': 208,
|
||||||
|
'liğ': 209,
|
||||||
|
'min': 210,
|
||||||
|
'tır': 211,
|
||||||
|
'ulu': 212,
|
||||||
|
'unu': 213,
|
||||||
|
'yap': 214,
|
||||||
|
'ye ': 215,
|
||||||
|
'ı i': 216,
|
||||||
|
'şka': 217,
|
||||||
|
'ştı': 218,
|
||||||
|
' bü': 219,
|
||||||
|
' ke': 220,
|
||||||
|
' ki': 221,
|
||||||
|
'ard': 222,
|
||||||
|
'art': 223,
|
||||||
|
'aşa': 224,
|
||||||
|
'n i': 225,
|
||||||
|
'ndi': 226,
|
||||||
|
'ti ': 227,
|
||||||
|
'top': 228,
|
||||||
|
'ı b': 229,
|
||||||
|
' va': 230,
|
||||||
|
' ön': 231,
|
||||||
|
'aki': 232,
|
||||||
|
'cak': 233,
|
||||||
|
'ey ': 234,
|
||||||
|
'fil': 235,
|
||||||
|
'isi': 236,
|
||||||
|
'kle': 237,
|
||||||
|
'kur': 238,
|
||||||
|
'man': 239,
|
||||||
|
'nce': 240,
|
||||||
|
'nle': 241,
|
||||||
|
'nun': 242,
|
||||||
|
'rak': 243,
|
||||||
|
'ık ': 244,
|
||||||
|
' en': 245,
|
||||||
|
' yo': 246,
|
||||||
|
'a g': 247,
|
||||||
|
'lis': 248,
|
||||||
|
'mak': 249,
|
||||||
|
'n g': 250,
|
||||||
|
'tir': 251,
|
||||||
|
'yas': 252,
|
||||||
|
' iş': 253,
|
||||||
|
' yö': 254,
|
||||||
|
'ale': 255,
|
||||||
|
'bil': 256,
|
||||||
|
'bul': 257,
|
||||||
|
'et ': 258,
|
||||||
|
'i d': 259,
|
||||||
|
'iye': 260,
|
||||||
|
'kil': 261,
|
||||||
|
'ma ': 262,
|
||||||
|
'n e': 263,
|
||||||
|
'n t': 264,
|
||||||
|
'nu ': 265,
|
||||||
|
'olu': 266,
|
||||||
|
'rla': 267,
|
||||||
|
'te ': 268,
|
||||||
|
'yön': 269,
|
||||||
|
'çık': 270,
|
||||||
|
' ay': 271,
|
||||||
|
' mü': 272,
|
||||||
|
' ço': 273,
|
||||||
|
' çı': 274,
|
||||||
|
'a a': 275,
|
||||||
|
'a b': 276,
|
||||||
|
'ata': 277,
|
||||||
|
'der': 278,
|
||||||
|
'gel': 279,
|
||||||
|
'i g': 280,
|
||||||
|
'i i': 281,
|
||||||
|
'ill': 282,
|
||||||
|
'ist': 283,
|
||||||
|
'ldı': 284,
|
||||||
|
'lu ': 285,
|
||||||
|
'mek': 286,
|
||||||
|
'mle': 287,
|
||||||
|
'n ç': 288,
|
||||||
|
'onu': 289,
|
||||||
|
'opl': 290,
|
||||||
|
'ran': 291,
|
||||||
|
'rat': 292,
|
||||||
|
'rdı': 293,
|
||||||
|
'rke': 294,
|
||||||
|
'siy': 295,
|
||||||
|
'son': 296,
|
||||||
|
'ta ': 297,
|
||||||
|
'tçı': 298,
|
||||||
|
'tın': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/ts.py
Normal file
303
libs/guess_language/data/models/ts.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
' ku': 0,
|
||||||
|
'ku ': 1,
|
||||||
|
'na ': 2,
|
||||||
|
'ka ': 3,
|
||||||
|
'wa ': 4,
|
||||||
|
'a n': 5,
|
||||||
|
' sw': 6,
|
||||||
|
'a m': 7,
|
||||||
|
'ya ': 8,
|
||||||
|
'a k': 9,
|
||||||
|
' ti': 10,
|
||||||
|
'swi': 11,
|
||||||
|
'hi ': 12,
|
||||||
|
'la ': 13,
|
||||||
|
' ya': 14,
|
||||||
|
' le': 15,
|
||||||
|
' hi': 16,
|
||||||
|
'a t': 17,
|
||||||
|
'a v': 18,
|
||||||
|
' va': 19,
|
||||||
|
'ni ': 20,
|
||||||
|
' na': 21,
|
||||||
|
'ndz': 22,
|
||||||
|
' ma': 23,
|
||||||
|
'a h': 24,
|
||||||
|
' xi': 25,
|
||||||
|
'a s': 26,
|
||||||
|
'i n': 27,
|
||||||
|
'ele': 28,
|
||||||
|
'i k': 29,
|
||||||
|
'ana': 30,
|
||||||
|
'a l': 31,
|
||||||
|
'nga': 32,
|
||||||
|
'lo ': 33,
|
||||||
|
'va ': 34,
|
||||||
|
'le ': 35,
|
||||||
|
'aka': 36,
|
||||||
|
'ela': 37,
|
||||||
|
'irh': 38,
|
||||||
|
'eka': 39,
|
||||||
|
' vu': 40,
|
||||||
|
'iwa': 41,
|
||||||
|
'a x': 42,
|
||||||
|
' ka': 43,
|
||||||
|
'yi ': 44,
|
||||||
|
' wa': 45,
|
||||||
|
'isa': 46,
|
||||||
|
'sa ': 47,
|
||||||
|
'ko ': 48,
|
||||||
|
'ta ': 49,
|
||||||
|
'ga ': 50,
|
||||||
|
'wu ': 51,
|
||||||
|
'wi ': 52,
|
||||||
|
'tir': 53,
|
||||||
|
' ek': 54,
|
||||||
|
' mi': 55,
|
||||||
|
' ni': 56,
|
||||||
|
'o y': 57,
|
||||||
|
'elo': 58,
|
||||||
|
'awu': 59,
|
||||||
|
'isi': 60,
|
||||||
|
'swa': 61,
|
||||||
|
'i t': 62,
|
||||||
|
'hla': 63,
|
||||||
|
'a e': 64,
|
||||||
|
' ta': 65,
|
||||||
|
' ng': 66,
|
||||||
|
' la': 67,
|
||||||
|
'a y': 68,
|
||||||
|
'ri ': 69,
|
||||||
|
'eri': 70,
|
||||||
|
' ri': 71,
|
||||||
|
'rhi': 72,
|
||||||
|
'eke': 73,
|
||||||
|
'umb': 74,
|
||||||
|
'u t': 75,
|
||||||
|
'ndl': 76,
|
||||||
|
' yi': 77,
|
||||||
|
'lan': 78,
|
||||||
|
'i v': 79,
|
||||||
|
'esw': 80,
|
||||||
|
'mbe': 81,
|
||||||
|
'i l': 82,
|
||||||
|
'a r': 83,
|
||||||
|
'e k': 84,
|
||||||
|
'ang': 85,
|
||||||
|
'les': 86,
|
||||||
|
'ula': 87,
|
||||||
|
'ti ': 88,
|
||||||
|
'yon': 89,
|
||||||
|
'o w': 90,
|
||||||
|
'ona': 91,
|
||||||
|
'law': 92,
|
||||||
|
'xa ': 93,
|
||||||
|
'nel': 94,
|
||||||
|
'yo ': 95,
|
||||||
|
'lel': 96,
|
||||||
|
'iko': 97,
|
||||||
|
' lo': 98,
|
||||||
|
'amb': 99,
|
||||||
|
' a ': 100,
|
||||||
|
'i y': 101,
|
||||||
|
' xa': 102,
|
||||||
|
'ane': 103,
|
||||||
|
'wan': 104,
|
||||||
|
'i s': 105,
|
||||||
|
'ond': 106,
|
||||||
|
'fan': 107,
|
||||||
|
'end': 108,
|
||||||
|
'i h': 109,
|
||||||
|
'o l': 110,
|
||||||
|
'u k': 111,
|
||||||
|
'mbi': 112,
|
||||||
|
"n'w": 113,
|
||||||
|
'ke ': 114,
|
||||||
|
'dyo': 115,
|
||||||
|
' fa': 116,
|
||||||
|
'lam': 117,
|
||||||
|
'nhl': 118,
|
||||||
|
'o s': 119,
|
||||||
|
'ong': 120,
|
||||||
|
'no ': 121,
|
||||||
|
' ko': 122,
|
||||||
|
'u n': 123,
|
||||||
|
' ha': 124,
|
||||||
|
'ho ': 125,
|
||||||
|
'oko': 126,
|
||||||
|
'u h': 127,
|
||||||
|
'i m': 128,
|
||||||
|
'o n': 129,
|
||||||
|
' yo': 130,
|
||||||
|
'ngu': 131,
|
||||||
|
'o k': 132,
|
||||||
|
'u y': 133,
|
||||||
|
'ati': 134,
|
||||||
|
'u l': 135,
|
||||||
|
'van': 136,
|
||||||
|
'ulu': 137,
|
||||||
|
'and': 138,
|
||||||
|
'mba': 139,
|
||||||
|
'kum': 140,
|
||||||
|
'u v': 141,
|
||||||
|
'wo ': 142,
|
||||||
|
'be ': 143,
|
||||||
|
'ha ': 144,
|
||||||
|
'riw': 145,
|
||||||
|
'dza': 146,
|
||||||
|
'si ': 147,
|
||||||
|
' en': 148,
|
||||||
|
'o h': 149,
|
||||||
|
' hl': 150,
|
||||||
|
'o t': 151,
|
||||||
|
'eyi': 152,
|
||||||
|
' nt': 153,
|
||||||
|
'ila': 154,
|
||||||
|
'lok': 155,
|
||||||
|
'dzi': 156,
|
||||||
|
'nge': 157,
|
||||||
|
' mu': 158,
|
||||||
|
'ala': 159,
|
||||||
|
'to ': 160,
|
||||||
|
'a w': 161,
|
||||||
|
' by': 162,
|
||||||
|
'arh': 163,
|
||||||
|
'aku': 164,
|
||||||
|
'tsa': 165,
|
||||||
|
'wak': 166,
|
||||||
|
'rho': 167,
|
||||||
|
"'wa": 168,
|
||||||
|
' nd': 169,
|
||||||
|
'min': 170,
|
||||||
|
'lav': 171,
|
||||||
|
'tim': 172,
|
||||||
|
'ley': 173,
|
||||||
|
'tik': 174,
|
||||||
|
'dle': 175,
|
||||||
|
'tin': 176,
|
||||||
|
'mat': 177,
|
||||||
|
'ler': 178,
|
||||||
|
'let': 179,
|
||||||
|
'sel': 180,
|
||||||
|
'his': 181,
|
||||||
|
'mel': 182,
|
||||||
|
'lu ': 183,
|
||||||
|
'ika': 184,
|
||||||
|
'a a': 185,
|
||||||
|
'ngo': 186,
|
||||||
|
'eng': 187,
|
||||||
|
'o x': 188,
|
||||||
|
' nk': 189,
|
||||||
|
'amu': 190,
|
||||||
|
'siw': 191,
|
||||||
|
'ani': 192,
|
||||||
|
'eni': 193,
|
||||||
|
'ma ': 194,
|
||||||
|
' nh': 195,
|
||||||
|
'mi ': 196,
|
||||||
|
'swo': 197,
|
||||||
|
'eti': 198,
|
||||||
|
'tan': 199,
|
||||||
|
'mo ': 200,
|
||||||
|
'ham': 201,
|
||||||
|
'iwe': 202,
|
||||||
|
' kh': 203,
|
||||||
|
'han': 204,
|
||||||
|
'lek': 205,
|
||||||
|
'nti': 206,
|
||||||
|
'ung': 207,
|
||||||
|
'hak': 208,
|
||||||
|
'dzo': 209,
|
||||||
|
'ete': 210,
|
||||||
|
' ts': 211,
|
||||||
|
'ava': 212,
|
||||||
|
'hu ': 213,
|
||||||
|
'fum': 214,
|
||||||
|
'kar': 215,
|
||||||
|
'vul': 216,
|
||||||
|
' wu': 217,
|
||||||
|
'kul': 218,
|
||||||
|
'und': 219,
|
||||||
|
'i x': 220,
|
||||||
|
'nhu': 221,
|
||||||
|
'yis': 222,
|
||||||
|
'xik': 223,
|
||||||
|
'bis': 224,
|
||||||
|
'xi ': 225,
|
||||||
|
'e y': 226,
|
||||||
|
'ra ': 227,
|
||||||
|
'hle': 228,
|
||||||
|
' hu': 229,
|
||||||
|
'wek': 230,
|
||||||
|
'ano': 231,
|
||||||
|
'yen': 232,
|
||||||
|
'a d': 233,
|
||||||
|
'sis': 234,
|
||||||
|
'olo': 235,
|
||||||
|
'pfu': 236,
|
||||||
|
'i w': 237,
|
||||||
|
'nyi': 238,
|
||||||
|
'e n': 239,
|
||||||
|
'so ': 240,
|
||||||
|
'ki ': 241,
|
||||||
|
'fun': 242,
|
||||||
|
'iso': 243,
|
||||||
|
'tsh': 244,
|
||||||
|
'kon': 245,
|
||||||
|
'nku': 246,
|
||||||
|
'hel': 247,
|
||||||
|
'i b': 248,
|
||||||
|
'e h': 249,
|
||||||
|
'ari': 250,
|
||||||
|
'imi': 251,
|
||||||
|
'i e': 252,
|
||||||
|
'ind': 253,
|
||||||
|
'vum': 254,
|
||||||
|
'nts': 255,
|
||||||
|
'ime': 256,
|
||||||
|
'kom': 257,
|
||||||
|
'mfu': 258,
|
||||||
|
'ise': 259,
|
||||||
|
' mf': 260,
|
||||||
|
'hin': 261,
|
||||||
|
'dla': 262,
|
||||||
|
'vut': 263,
|
||||||
|
'gan': 264,
|
||||||
|
'i r': 265,
|
||||||
|
'ban': 266,
|
||||||
|
'bya': 267,
|
||||||
|
'mil': 268,
|
||||||
|
'int': 269,
|
||||||
|
'ats': 270,
|
||||||
|
' dy': 271,
|
||||||
|
'u s': 272,
|
||||||
|
'e x': 273,
|
||||||
|
'ile': 274,
|
||||||
|
'kel': 275,
|
||||||
|
'kwa': 276,
|
||||||
|
' no': 277,
|
||||||
|
'i f': 278,
|
||||||
|
'asi': 279,
|
||||||
|
'za ': 280,
|
||||||
|
'uri': 281,
|
||||||
|
'o m': 282,
|
||||||
|
'rha': 283,
|
||||||
|
'e l': 284,
|
||||||
|
"in'": 285,
|
||||||
|
'eta': 286,
|
||||||
|
'von': 287,
|
||||||
|
'i a': 288,
|
||||||
|
'kho': 289,
|
||||||
|
' wo': 290,
|
||||||
|
'iki': 291,
|
||||||
|
' ra': 292,
|
||||||
|
'u e': 293,
|
||||||
|
'o e': 294,
|
||||||
|
'zo ': 295,
|
||||||
|
'yin': 296,
|
||||||
|
'ink': 297,
|
||||||
|
'any': 298,
|
||||||
|
'ket': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/uk.py
Normal file
303
libs/guess_language/data/models/uk.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
' на': 0,
|
||||||
|
' за': 1,
|
||||||
|
'ння': 2,
|
||||||
|
'ня ': 3,
|
||||||
|
'на ': 4,
|
||||||
|
' пр': 5,
|
||||||
|
'ого': 6,
|
||||||
|
'го ': 7,
|
||||||
|
'ськ': 8,
|
||||||
|
' по': 9,
|
||||||
|
' у ': 10,
|
||||||
|
'від': 11,
|
||||||
|
'ере': 12,
|
||||||
|
' мі': 13,
|
||||||
|
' не': 14,
|
||||||
|
'их ': 15,
|
||||||
|
'ть ': 16,
|
||||||
|
'пер': 17,
|
||||||
|
' ві': 18,
|
||||||
|
'ів ': 19,
|
||||||
|
' пе': 20,
|
||||||
|
' що': 21,
|
||||||
|
'льн': 22,
|
||||||
|
'ми ': 23,
|
||||||
|
'ні ': 24,
|
||||||
|
'не ': 25,
|
||||||
|
'ти ': 26,
|
||||||
|
'ати': 27,
|
||||||
|
'енн': 28,
|
||||||
|
'міс': 29,
|
||||||
|
'пра': 30,
|
||||||
|
'ува': 31,
|
||||||
|
'ник': 32,
|
||||||
|
'про': 33,
|
||||||
|
'рав': 34,
|
||||||
|
'івн': 35,
|
||||||
|
' та': 36,
|
||||||
|
'буд': 37,
|
||||||
|
'влі': 38,
|
||||||
|
'рів': 39,
|
||||||
|
' ко': 40,
|
||||||
|
' рі': 41,
|
||||||
|
'аль': 42,
|
||||||
|
'но ': 43,
|
||||||
|
'ому': 44,
|
||||||
|
'що ': 45,
|
||||||
|
' ви': 46,
|
||||||
|
'му ': 47,
|
||||||
|
'рев': 48,
|
||||||
|
'ся ': 49,
|
||||||
|
'інн': 50,
|
||||||
|
' до': 51,
|
||||||
|
' уп': 52,
|
||||||
|
'авл': 53,
|
||||||
|
'анн': 54,
|
||||||
|
'ком': 55,
|
||||||
|
'ли ': 56,
|
||||||
|
'лін': 57,
|
||||||
|
'ног': 58,
|
||||||
|
'упр': 59,
|
||||||
|
' бу': 60,
|
||||||
|
' з ': 61,
|
||||||
|
' ро': 62,
|
||||||
|
'за ': 63,
|
||||||
|
'и н': 64,
|
||||||
|
'нов': 65,
|
||||||
|
'оро': 66,
|
||||||
|
'ост': 67,
|
||||||
|
'ста': 68,
|
||||||
|
'ті ': 69,
|
||||||
|
'ють': 70,
|
||||||
|
' мо': 71,
|
||||||
|
' ні': 72,
|
||||||
|
' як': 73,
|
||||||
|
'бор': 74,
|
||||||
|
'ва ': 75,
|
||||||
|
'ван': 76,
|
||||||
|
'ень': 77,
|
||||||
|
'и п': 78,
|
||||||
|
'нь ': 79,
|
||||||
|
'ові': 80,
|
||||||
|
'рон': 81,
|
||||||
|
'сті': 82,
|
||||||
|
'та ': 83,
|
||||||
|
'у в': 84,
|
||||||
|
'ько': 85,
|
||||||
|
'іст': 86,
|
||||||
|
' в ': 87,
|
||||||
|
' ре': 88,
|
||||||
|
'до ': 89,
|
||||||
|
'е п': 90,
|
||||||
|
'заб': 91,
|
||||||
|
'ий ': 92,
|
||||||
|
'нсь': 93,
|
||||||
|
'о в': 94,
|
||||||
|
'о п': 95,
|
||||||
|
'при': 96,
|
||||||
|
'і п': 97,
|
||||||
|
' ку': 98,
|
||||||
|
' пі': 99,
|
||||||
|
' сп': 100,
|
||||||
|
'а п': 101,
|
||||||
|
'або': 102,
|
||||||
|
'анс': 103,
|
||||||
|
'аці': 104,
|
||||||
|
'ват': 105,
|
||||||
|
'вни': 106,
|
||||||
|
'и в': 107,
|
||||||
|
'ими': 108,
|
||||||
|
'ка ': 109,
|
||||||
|
'нен': 110,
|
||||||
|
'ніч': 111,
|
||||||
|
'она': 112,
|
||||||
|
'ої ': 113,
|
||||||
|
'пов': 114,
|
||||||
|
'ьки': 115,
|
||||||
|
'ьно': 116,
|
||||||
|
'ізн': 117,
|
||||||
|
'ічн': 118,
|
||||||
|
' ав': 119,
|
||||||
|
' ма': 120,
|
||||||
|
' ор': 121,
|
||||||
|
' су': 122,
|
||||||
|
' чи': 123,
|
||||||
|
' ін': 124,
|
||||||
|
'а з': 125,
|
||||||
|
'ам ': 126,
|
||||||
|
'ає ': 127,
|
||||||
|
'вне': 128,
|
||||||
|
'вто': 129,
|
||||||
|
'дом': 130,
|
||||||
|
'ент': 131,
|
||||||
|
'жит': 132,
|
||||||
|
'зни': 133,
|
||||||
|
'им ': 134,
|
||||||
|
'итл': 135,
|
||||||
|
'ла ': 136,
|
||||||
|
'них': 137,
|
||||||
|
'ниц': 138,
|
||||||
|
'ова': 139,
|
||||||
|
'ови': 140,
|
||||||
|
'ом ': 141,
|
||||||
|
'пор': 142,
|
||||||
|
'тьс': 143,
|
||||||
|
'у р': 144,
|
||||||
|
'ься': 145,
|
||||||
|
'ідо': 146,
|
||||||
|
'іль': 147,
|
||||||
|
'ісь': 148,
|
||||||
|
' ва': 149,
|
||||||
|
' ді': 150,
|
||||||
|
' жи': 151,
|
||||||
|
' че': 152,
|
||||||
|
' і ': 153,
|
||||||
|
'а в': 154,
|
||||||
|
'а н': 155,
|
||||||
|
'али': 156,
|
||||||
|
'вез': 157,
|
||||||
|
'вно': 158,
|
||||||
|
'еве': 159,
|
||||||
|
'езе': 160,
|
||||||
|
'зен': 161,
|
||||||
|
'ицт': 162,
|
||||||
|
'ки ': 163,
|
||||||
|
'ких': 164,
|
||||||
|
'кон': 165,
|
||||||
|
'ку ': 166,
|
||||||
|
'лас': 167,
|
||||||
|
'ля ': 168,
|
||||||
|
'мож': 169,
|
||||||
|
'нач': 170,
|
||||||
|
'ним': 171,
|
||||||
|
'ної': 172,
|
||||||
|
'о б': 173,
|
||||||
|
'ову': 174,
|
||||||
|
'оди': 175,
|
||||||
|
'ою ': 176,
|
||||||
|
'ро ': 177,
|
||||||
|
'рок': 178,
|
||||||
|
'сно': 179,
|
||||||
|
'спо': 180,
|
||||||
|
'так': 181,
|
||||||
|
'тва': 182,
|
||||||
|
'ту ': 183,
|
||||||
|
'у п': 184,
|
||||||
|
'цтв': 185,
|
||||||
|
'ьни': 186,
|
||||||
|
'я з': 187,
|
||||||
|
'і м': 188,
|
||||||
|
'ії ': 189,
|
||||||
|
' вс': 190,
|
||||||
|
' гр': 191,
|
||||||
|
' де': 192,
|
||||||
|
' но': 193,
|
||||||
|
' па': 194,
|
||||||
|
' се': 195,
|
||||||
|
' ук': 196,
|
||||||
|
' їх': 197,
|
||||||
|
'а о': 198,
|
||||||
|
'авт': 199,
|
||||||
|
'аст': 200,
|
||||||
|
'ают': 201,
|
||||||
|
'вар': 202,
|
||||||
|
'ден': 203,
|
||||||
|
'ди ': 204,
|
||||||
|
'ду ': 205,
|
||||||
|
'зна': 206,
|
||||||
|
'и з': 207,
|
||||||
|
'ико': 208,
|
||||||
|
'ися': 209,
|
||||||
|
'ити': 210,
|
||||||
|
'ког': 211,
|
||||||
|
'мен': 212,
|
||||||
|
'ном': 213,
|
||||||
|
'ну ': 214,
|
||||||
|
'о н': 215,
|
||||||
|
'о с': 216,
|
||||||
|
'обу': 217,
|
||||||
|
'ово': 218,
|
||||||
|
'пла': 219,
|
||||||
|
'ран': 220,
|
||||||
|
'рив': 221,
|
||||||
|
'роб': 222,
|
||||||
|
'ска': 223,
|
||||||
|
'тан': 224,
|
||||||
|
'тим': 225,
|
||||||
|
'тис': 226,
|
||||||
|
'то ': 227,
|
||||||
|
'тра': 228,
|
||||||
|
'удо': 229,
|
||||||
|
'чин': 230,
|
||||||
|
'чни': 231,
|
||||||
|
'і в': 232,
|
||||||
|
'ію ': 233,
|
||||||
|
' а ': 234,
|
||||||
|
' во': 235,
|
||||||
|
' да': 236,
|
||||||
|
' кв': 237,
|
||||||
|
' ме': 238,
|
||||||
|
' об': 239,
|
||||||
|
' ск': 240,
|
||||||
|
' ти': 241,
|
||||||
|
' фі': 242,
|
||||||
|
' є ': 243,
|
||||||
|
'а р': 244,
|
||||||
|
'а с': 245,
|
||||||
|
'а у': 246,
|
||||||
|
'ак ': 247,
|
||||||
|
'ані': 248,
|
||||||
|
'арт': 249,
|
||||||
|
'асн': 250,
|
||||||
|
'в у': 251,
|
||||||
|
'вик': 252,
|
||||||
|
'віз': 253,
|
||||||
|
'дов': 254,
|
||||||
|
'дпо': 255,
|
||||||
|
'дів': 256,
|
||||||
|
'еві': 257,
|
||||||
|
'енс': 258,
|
||||||
|
'же ': 259,
|
||||||
|
'и м': 260,
|
||||||
|
'и с': 261,
|
||||||
|
'ика': 262,
|
||||||
|
'ичн': 263,
|
||||||
|
'кі ': 264,
|
||||||
|
'ків': 265,
|
||||||
|
'між': 266,
|
||||||
|
'нан': 267,
|
||||||
|
'нос': 268,
|
||||||
|
'о у': 269,
|
||||||
|
'обл': 270,
|
||||||
|
'одн': 271,
|
||||||
|
'ок ': 272,
|
||||||
|
'оло': 273,
|
||||||
|
'отр': 274,
|
||||||
|
'рен': 275,
|
||||||
|
'рим': 276,
|
||||||
|
'роз': 277,
|
||||||
|
'сь ': 278,
|
||||||
|
'сі ': 279,
|
||||||
|
'тла': 280,
|
||||||
|
'тів': 281,
|
||||||
|
'у з': 282,
|
||||||
|
'уго': 283,
|
||||||
|
'уді': 284,
|
||||||
|
'чи ': 285,
|
||||||
|
'ше ': 286,
|
||||||
|
'я н': 287,
|
||||||
|
'я у': 288,
|
||||||
|
'ідп': 289,
|
||||||
|
'ій ': 290,
|
||||||
|
'іна': 291,
|
||||||
|
'ія ': 292,
|
||||||
|
' ка': 293,
|
||||||
|
' ни': 294,
|
||||||
|
' ос': 295,
|
||||||
|
' си': 296,
|
||||||
|
' то': 297,
|
||||||
|
' тр': 298,
|
||||||
|
' уг': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/ur.py
Normal file
303
libs/guess_language/data/models/ur.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'یں ': 0,
|
||||||
|
' کی': 1,
|
||||||
|
'کے ': 2,
|
||||||
|
' کے': 3,
|
||||||
|
'نے ': 4,
|
||||||
|
' کہ': 5,
|
||||||
|
'ے ک': 6,
|
||||||
|
'کی ': 7,
|
||||||
|
'میں': 8,
|
||||||
|
' می': 9,
|
||||||
|
'ہے ': 10,
|
||||||
|
'وں ': 11,
|
||||||
|
'کہ ': 12,
|
||||||
|
' ہے': 13,
|
||||||
|
'ان ': 14,
|
||||||
|
'ہیں': 15,
|
||||||
|
'ور ': 16,
|
||||||
|
' کو': 17,
|
||||||
|
'یا ': 18,
|
||||||
|
' ان': 19,
|
||||||
|
' نے': 20,
|
||||||
|
'سے ': 21,
|
||||||
|
' سے': 22,
|
||||||
|
' کر': 23,
|
||||||
|
'ستا': 24,
|
||||||
|
' او': 25,
|
||||||
|
'اور': 26,
|
||||||
|
'تان': 27,
|
||||||
|
'ر ک': 28,
|
||||||
|
'ی ک': 29,
|
||||||
|
' اس': 30,
|
||||||
|
'ے ا': 31,
|
||||||
|
' پا': 32,
|
||||||
|
' ہو': 33,
|
||||||
|
' پر': 34,
|
||||||
|
'رف ': 35,
|
||||||
|
' کا': 36,
|
||||||
|
'ا ک': 37,
|
||||||
|
'ی ا': 38,
|
||||||
|
' ہی': 39,
|
||||||
|
'در ': 40,
|
||||||
|
'کو ': 41,
|
||||||
|
' ای': 42,
|
||||||
|
'ں ک': 43,
|
||||||
|
' مش': 44,
|
||||||
|
' مل': 45,
|
||||||
|
'ات ': 46,
|
||||||
|
'صدر': 47,
|
||||||
|
'اکس': 48,
|
||||||
|
'شرف': 49,
|
||||||
|
'مشر': 50,
|
||||||
|
'پاک': 51,
|
||||||
|
'کست': 52,
|
||||||
|
'ی م': 53,
|
||||||
|
' دی': 54,
|
||||||
|
' صد': 55,
|
||||||
|
' یہ': 56,
|
||||||
|
'ا ہ': 57,
|
||||||
|
'ن ک': 58,
|
||||||
|
'وال': 59,
|
||||||
|
'یہ ': 60,
|
||||||
|
'ے و': 61,
|
||||||
|
' بھ': 62,
|
||||||
|
' دو': 63,
|
||||||
|
'اس ': 64,
|
||||||
|
'ر ا': 65,
|
||||||
|
'نہی': 66,
|
||||||
|
'کا ': 67,
|
||||||
|
'ے س': 68,
|
||||||
|
'ئی ': 69,
|
||||||
|
'ہ ا': 70,
|
||||||
|
'یت ': 71,
|
||||||
|
'ے ہ': 72,
|
||||||
|
'ت ک': 73,
|
||||||
|
' سا': 74,
|
||||||
|
'لے ': 75,
|
||||||
|
'ہا ': 76,
|
||||||
|
'ے ب': 77,
|
||||||
|
' وا': 78,
|
||||||
|
'ار ': 79,
|
||||||
|
'نی ': 80,
|
||||||
|
'کہا': 81,
|
||||||
|
'ی ہ': 82,
|
||||||
|
'ے م': 83,
|
||||||
|
' سی': 84,
|
||||||
|
' لی': 85,
|
||||||
|
'انہ': 86,
|
||||||
|
'انی': 87,
|
||||||
|
'ر م': 88,
|
||||||
|
'ر پ': 89,
|
||||||
|
'ریت': 90,
|
||||||
|
'ن م': 91,
|
||||||
|
'ھا ': 92,
|
||||||
|
'یر ': 93,
|
||||||
|
' جا': 94,
|
||||||
|
' جن': 95,
|
||||||
|
'ئے ': 96,
|
||||||
|
'پر ': 97,
|
||||||
|
'ں ن': 98,
|
||||||
|
'ہ ک': 99,
|
||||||
|
'ی و': 100,
|
||||||
|
'ے د': 101,
|
||||||
|
' تو': 102,
|
||||||
|
' تھ': 103,
|
||||||
|
' گی': 104,
|
||||||
|
'ایک': 105,
|
||||||
|
'ل ک': 106,
|
||||||
|
'نا ': 107,
|
||||||
|
'کر ': 108,
|
||||||
|
'ں م': 109,
|
||||||
|
'یک ': 110,
|
||||||
|
' با': 111,
|
||||||
|
'ا ت': 112,
|
||||||
|
'دی ': 113,
|
||||||
|
'ن س': 114,
|
||||||
|
'کیا': 115,
|
||||||
|
'یوں': 116,
|
||||||
|
'ے ج': 117,
|
||||||
|
'ال ': 118,
|
||||||
|
'تو ': 119,
|
||||||
|
'ں ا': 120,
|
||||||
|
'ے پ': 121,
|
||||||
|
' چا': 122,
|
||||||
|
'ام ': 123,
|
||||||
|
'بھی': 124,
|
||||||
|
'تی ': 125,
|
||||||
|
'تے ': 126,
|
||||||
|
'دوس': 127,
|
||||||
|
'س ک': 128,
|
||||||
|
'ملک': 129,
|
||||||
|
'ن ا': 130,
|
||||||
|
'ہور': 131,
|
||||||
|
'یے ': 132,
|
||||||
|
' مو': 133,
|
||||||
|
' وک': 134,
|
||||||
|
'ائی': 135,
|
||||||
|
'ارت': 136,
|
||||||
|
'الے': 137,
|
||||||
|
'بھا': 138,
|
||||||
|
'ردی': 139,
|
||||||
|
'ری ': 140,
|
||||||
|
'وہ ': 141,
|
||||||
|
'ویز': 142,
|
||||||
|
'ں د': 143,
|
||||||
|
'ھی ': 144,
|
||||||
|
'ی س': 145,
|
||||||
|
' رہ': 146,
|
||||||
|
' من': 147,
|
||||||
|
' نہ': 148,
|
||||||
|
' ور': 149,
|
||||||
|
' وہ': 150,
|
||||||
|
' ہن': 151,
|
||||||
|
'ا ا': 152,
|
||||||
|
'است': 153,
|
||||||
|
'ت ا': 154,
|
||||||
|
'ت پ': 155,
|
||||||
|
'د ک': 156,
|
||||||
|
'ز م': 157,
|
||||||
|
'ند ': 158,
|
||||||
|
'ورد': 159,
|
||||||
|
'وکل': 160,
|
||||||
|
'گی ': 161,
|
||||||
|
'گیا': 162,
|
||||||
|
'ہ پ': 163,
|
||||||
|
'یز ': 164,
|
||||||
|
'ے ت': 165,
|
||||||
|
' اع': 166,
|
||||||
|
' اپ': 167,
|
||||||
|
' جس': 168,
|
||||||
|
' جم': 169,
|
||||||
|
' جو': 170,
|
||||||
|
' سر': 171,
|
||||||
|
'اپن': 172,
|
||||||
|
'اکث': 173,
|
||||||
|
'تھا': 174,
|
||||||
|
'ثری': 175,
|
||||||
|
'دیا': 176,
|
||||||
|
'ر د': 177,
|
||||||
|
'رت ': 178,
|
||||||
|
'روی': 179,
|
||||||
|
'سی ': 180,
|
||||||
|
'ملا': 181,
|
||||||
|
'ندو': 182,
|
||||||
|
'وست': 183,
|
||||||
|
'پرو': 184,
|
||||||
|
'چاہ': 185,
|
||||||
|
'کثر': 186,
|
||||||
|
'کلا': 187,
|
||||||
|
'ہ ہ': 188,
|
||||||
|
'ہند': 189,
|
||||||
|
'ہو ': 190,
|
||||||
|
'ے ل': 191,
|
||||||
|
' اک': 192,
|
||||||
|
' دا': 193,
|
||||||
|
' سن': 194,
|
||||||
|
' وز': 195,
|
||||||
|
' پی': 196,
|
||||||
|
'ا چ': 197,
|
||||||
|
'اء ': 198,
|
||||||
|
'اتھ': 199,
|
||||||
|
'اقا': 200,
|
||||||
|
'اہ ': 201,
|
||||||
|
'تھ ': 202,
|
||||||
|
'دو ': 203,
|
||||||
|
'ر ب': 204,
|
||||||
|
'روا': 205,
|
||||||
|
'رے ': 206,
|
||||||
|
'سات': 207,
|
||||||
|
'ف ک': 208,
|
||||||
|
'قات': 209,
|
||||||
|
'لا ': 210,
|
||||||
|
'لاء': 211,
|
||||||
|
'م م': 212,
|
||||||
|
'م ک': 213,
|
||||||
|
'من ': 214,
|
||||||
|
'نوں': 215,
|
||||||
|
'و ا': 216,
|
||||||
|
'کرن': 217,
|
||||||
|
'ں ہ': 218,
|
||||||
|
'ھار': 219,
|
||||||
|
'ہوئ': 220,
|
||||||
|
'ہی ': 221,
|
||||||
|
'یش ': 222,
|
||||||
|
' ام': 223,
|
||||||
|
' لا': 224,
|
||||||
|
' مس': 225,
|
||||||
|
' پو': 226,
|
||||||
|
' پہ': 227,
|
||||||
|
'انے': 228,
|
||||||
|
'ت م': 229,
|
||||||
|
'ت ہ': 230,
|
||||||
|
'ج ک': 231,
|
||||||
|
'دون': 232,
|
||||||
|
'زیر': 233,
|
||||||
|
'س س': 234,
|
||||||
|
'ش ک': 235,
|
||||||
|
'ف ن': 236,
|
||||||
|
'ل ہ': 237,
|
||||||
|
'لاق': 238,
|
||||||
|
'لی ': 239,
|
||||||
|
'وری': 240,
|
||||||
|
'وزی': 241,
|
||||||
|
'ونو': 242,
|
||||||
|
'کھن': 243,
|
||||||
|
'گا ': 244,
|
||||||
|
'ں س': 245,
|
||||||
|
'ں گ': 246,
|
||||||
|
'ھنے': 247,
|
||||||
|
'ھے ': 248,
|
||||||
|
'ہ ب': 249,
|
||||||
|
'ہ ج': 250,
|
||||||
|
'ہر ': 251,
|
||||||
|
'ی آ': 252,
|
||||||
|
'ی پ': 253,
|
||||||
|
' حا': 254,
|
||||||
|
' وف': 255,
|
||||||
|
' گا': 256,
|
||||||
|
'ا ج': 257,
|
||||||
|
'ا گ': 258,
|
||||||
|
'اد ': 259,
|
||||||
|
'ادی': 260,
|
||||||
|
'اعظ': 261,
|
||||||
|
'اہت': 262,
|
||||||
|
'جس ': 263,
|
||||||
|
'جمہ': 264,
|
||||||
|
'جو ': 265,
|
||||||
|
'ر س': 266,
|
||||||
|
'ر ہ': 267,
|
||||||
|
'رنے': 268,
|
||||||
|
'س م': 269,
|
||||||
|
'سا ': 270,
|
||||||
|
'سند': 271,
|
||||||
|
'سنگ': 272,
|
||||||
|
'ظم ': 273,
|
||||||
|
'عظم': 274,
|
||||||
|
'ل م': 275,
|
||||||
|
'لیے': 276,
|
||||||
|
'مل ': 277,
|
||||||
|
'موہ': 278,
|
||||||
|
'مہو': 279,
|
||||||
|
'نگھ': 280,
|
||||||
|
'و ص': 281,
|
||||||
|
'ورٹ': 282,
|
||||||
|
'وہن': 283,
|
||||||
|
'کن ': 284,
|
||||||
|
'گھ ': 285,
|
||||||
|
'گے ': 286,
|
||||||
|
'ں ج': 287,
|
||||||
|
'ں و': 288,
|
||||||
|
'ں ی': 289,
|
||||||
|
'ہ د': 290,
|
||||||
|
'ہن ': 291,
|
||||||
|
'ہوں': 292,
|
||||||
|
'ے ح': 293,
|
||||||
|
'ے گ': 294,
|
||||||
|
'ے ی': 295,
|
||||||
|
' اگ': 296,
|
||||||
|
' بع': 297,
|
||||||
|
' رو': 298,
|
||||||
|
' شا': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/uz.py
Normal file
303
libs/guess_language/data/models/uz.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'ан ': 0,
|
||||||
|
'ган': 1,
|
||||||
|
'лар': 2,
|
||||||
|
'га ': 3,
|
||||||
|
'нг ': 4,
|
||||||
|
'инг': 5,
|
||||||
|
'нин': 6,
|
||||||
|
'да ': 7,
|
||||||
|
'ни ': 8,
|
||||||
|
'ида': 9,
|
||||||
|
'ари': 10,
|
||||||
|
'ига': 11,
|
||||||
|
'ини': 12,
|
||||||
|
'ар ': 13,
|
||||||
|
'ди ': 14,
|
||||||
|
' би': 15,
|
||||||
|
'ани': 16,
|
||||||
|
' бо': 17,
|
||||||
|
'дан': 18,
|
||||||
|
'лга': 19,
|
||||||
|
' ҳа': 20,
|
||||||
|
' ва': 21,
|
||||||
|
' са': 22,
|
||||||
|
'ги ': 23,
|
||||||
|
'ила': 24,
|
||||||
|
'н б': 25,
|
||||||
|
'и б': 26,
|
||||||
|
' кў': 27,
|
||||||
|
' та': 28,
|
||||||
|
'ир ': 29,
|
||||||
|
' ма': 30,
|
||||||
|
'ага': 31,
|
||||||
|
'ала': 32,
|
||||||
|
'бир': 33,
|
||||||
|
'ри ': 34,
|
||||||
|
'тга': 35,
|
||||||
|
'лан': 36,
|
||||||
|
'лик': 37,
|
||||||
|
'а к': 38,
|
||||||
|
'аги': 39,
|
||||||
|
'ати': 40,
|
||||||
|
'та ': 41,
|
||||||
|
'ади': 42,
|
||||||
|
'даг': 43,
|
||||||
|
'рга': 44,
|
||||||
|
' йи': 45,
|
||||||
|
' ми': 46,
|
||||||
|
' па': 47,
|
||||||
|
' бў': 48,
|
||||||
|
' қа': 49,
|
||||||
|
' қи': 50,
|
||||||
|
'а б': 51,
|
||||||
|
'илл': 52,
|
||||||
|
'ли ': 53,
|
||||||
|
'аси': 54,
|
||||||
|
'и т': 55,
|
||||||
|
'ик ': 56,
|
||||||
|
'или': 57,
|
||||||
|
'лла': 58,
|
||||||
|
'ард': 59,
|
||||||
|
'вчи': 60,
|
||||||
|
'ва ': 61,
|
||||||
|
'иб ': 62,
|
||||||
|
'ири': 63,
|
||||||
|
'лиг': 64,
|
||||||
|
'нга': 65,
|
||||||
|
'ран': 66,
|
||||||
|
' ке': 67,
|
||||||
|
' ўз': 68,
|
||||||
|
'а с': 69,
|
||||||
|
'ахт': 70,
|
||||||
|
'бўл': 71,
|
||||||
|
'иги': 72,
|
||||||
|
'кўр': 73,
|
||||||
|
'рда': 74,
|
||||||
|
'рни': 75,
|
||||||
|
'са ': 76,
|
||||||
|
' бе': 77,
|
||||||
|
' бу': 78,
|
||||||
|
' да': 79,
|
||||||
|
' жа': 80,
|
||||||
|
'а т': 81,
|
||||||
|
'ази': 82,
|
||||||
|
'ери': 83,
|
||||||
|
'и а': 84,
|
||||||
|
'илг': 85,
|
||||||
|
'йил': 86,
|
||||||
|
'ман': 87,
|
||||||
|
'пах': 88,
|
||||||
|
'рид': 89,
|
||||||
|
'ти ': 90,
|
||||||
|
'увч': 91,
|
||||||
|
'хта': 92,
|
||||||
|
' не': 93,
|
||||||
|
' со': 94,
|
||||||
|
' уч': 95,
|
||||||
|
'айт': 96,
|
||||||
|
'лли': 97,
|
||||||
|
'тла': 98,
|
||||||
|
' ай': 99,
|
||||||
|
' фр': 100,
|
||||||
|
' эт': 101,
|
||||||
|
' ҳо': 102,
|
||||||
|
'а қ': 103,
|
||||||
|
'али': 104,
|
||||||
|
'аро': 105,
|
||||||
|
'бер': 106,
|
||||||
|
'бил': 107,
|
||||||
|
'бор': 108,
|
||||||
|
'ими': 109,
|
||||||
|
'ист': 110,
|
||||||
|
'он ': 111,
|
||||||
|
'рин': 112,
|
||||||
|
'тер': 113,
|
||||||
|
'тил': 114,
|
||||||
|
'ун ': 115,
|
||||||
|
'фра': 116,
|
||||||
|
'қил': 117,
|
||||||
|
' ба': 118,
|
||||||
|
' ол': 119,
|
||||||
|
'анс': 120,
|
||||||
|
'ефт': 121,
|
||||||
|
'зир': 122,
|
||||||
|
'кат': 123,
|
||||||
|
'мил': 124,
|
||||||
|
'неф': 125,
|
||||||
|
'саг': 126,
|
||||||
|
'чи ': 127,
|
||||||
|
'ўра': 128,
|
||||||
|
' на': 129,
|
||||||
|
' те': 130,
|
||||||
|
' эн': 131,
|
||||||
|
'а э': 132,
|
||||||
|
'ам ': 133,
|
||||||
|
'арн': 134,
|
||||||
|
'ат ': 135,
|
||||||
|
'иш ': 136,
|
||||||
|
'ма ': 137,
|
||||||
|
'нла': 138,
|
||||||
|
'рли': 139,
|
||||||
|
'чил': 140,
|
||||||
|
'шга': 141,
|
||||||
|
' иш': 142,
|
||||||
|
' му': 143,
|
||||||
|
' ўқ': 144,
|
||||||
|
'ара': 145,
|
||||||
|
'ваз': 146,
|
||||||
|
'и у': 147,
|
||||||
|
'иқ ': 148,
|
||||||
|
'моқ': 149,
|
||||||
|
'рим': 150,
|
||||||
|
'учу': 151,
|
||||||
|
'чун': 152,
|
||||||
|
'ши ': 153,
|
||||||
|
'энг': 154,
|
||||||
|
'қув': 155,
|
||||||
|
'ҳам': 156,
|
||||||
|
' сў': 157,
|
||||||
|
' ши': 158,
|
||||||
|
'бар': 159,
|
||||||
|
'бек': 160,
|
||||||
|
'дам': 161,
|
||||||
|
'и ҳ': 162,
|
||||||
|
'иши': 163,
|
||||||
|
'лад': 164,
|
||||||
|
'оли': 165,
|
||||||
|
'олл': 166,
|
||||||
|
'ори': 167,
|
||||||
|
'оқд': 168,
|
||||||
|
'р б': 169,
|
||||||
|
'ра ': 170,
|
||||||
|
'рла': 171,
|
||||||
|
'уни': 172,
|
||||||
|
'фт ': 173,
|
||||||
|
'ўлг': 174,
|
||||||
|
'ўқу': 175,
|
||||||
|
' де': 176,
|
||||||
|
' ка': 177,
|
||||||
|
' қў': 178,
|
||||||
|
'а ў': 179,
|
||||||
|
'аба': 180,
|
||||||
|
'амм': 181,
|
||||||
|
'атл': 182,
|
||||||
|
'б к': 183,
|
||||||
|
'бош': 184,
|
||||||
|
'збе': 185,
|
||||||
|
'и в': 186,
|
||||||
|
'им ': 187,
|
||||||
|
'ин ': 188,
|
||||||
|
'ишл': 189,
|
||||||
|
'лаб': 190,
|
||||||
|
'лей': 191,
|
||||||
|
'мин': 192,
|
||||||
|
'н д': 193,
|
||||||
|
'нда': 194,
|
||||||
|
'оқ ': 195,
|
||||||
|
'р м': 196,
|
||||||
|
'рил': 197,
|
||||||
|
'сид': 198,
|
||||||
|
'тал': 199,
|
||||||
|
'тан': 200,
|
||||||
|
'тид': 201,
|
||||||
|
'тон': 202,
|
||||||
|
'ўзб': 203,
|
||||||
|
' ам': 204,
|
||||||
|
' ки': 205,
|
||||||
|
'а ҳ': 206,
|
||||||
|
'анг': 207,
|
||||||
|
'анд': 208,
|
||||||
|
'арт': 209,
|
||||||
|
'аёт': 210,
|
||||||
|
'дир': 211,
|
||||||
|
'ент': 212,
|
||||||
|
'и д': 213,
|
||||||
|
'и м': 214,
|
||||||
|
'и о': 215,
|
||||||
|
'и э': 216,
|
||||||
|
'иро': 217,
|
||||||
|
'йти': 218,
|
||||||
|
'нсу': 219,
|
||||||
|
'оди': 220,
|
||||||
|
'ор ': 221,
|
||||||
|
'си ': 222,
|
||||||
|
'тиш': 223,
|
||||||
|
'тоб': 224,
|
||||||
|
'эти': 225,
|
||||||
|
'қар': 226,
|
||||||
|
'қда': 227,
|
||||||
|
' бл': 228,
|
||||||
|
' ге': 229,
|
||||||
|
' до': 230,
|
||||||
|
' ду': 231,
|
||||||
|
' но': 232,
|
||||||
|
' пр': 233,
|
||||||
|
' ра': 234,
|
||||||
|
' фо': 235,
|
||||||
|
' қо': 236,
|
||||||
|
'а м': 237,
|
||||||
|
'а о': 238,
|
||||||
|
'айд': 239,
|
||||||
|
'ало': 240,
|
||||||
|
'ама': 241,
|
||||||
|
'бле': 242,
|
||||||
|
'г н': 243,
|
||||||
|
'дол': 244,
|
||||||
|
'ейр': 245,
|
||||||
|
'ек ': 246,
|
||||||
|
'ерг': 247,
|
||||||
|
'жар': 248,
|
||||||
|
'зид': 249,
|
||||||
|
'и к': 250,
|
||||||
|
'и ф': 251,
|
||||||
|
'ий ': 252,
|
||||||
|
'ило': 253,
|
||||||
|
'лди': 254,
|
||||||
|
'либ': 255,
|
||||||
|
'лин': 256,
|
||||||
|
'ми ': 257,
|
||||||
|
'мма': 258,
|
||||||
|
'н в': 259,
|
||||||
|
'н к': 260,
|
||||||
|
'н ў': 261,
|
||||||
|
'н ҳ': 262,
|
||||||
|
'ози': 263,
|
||||||
|
'ора': 264,
|
||||||
|
'оси': 265,
|
||||||
|
'рас': 266,
|
||||||
|
'риш': 267,
|
||||||
|
'рка': 268,
|
||||||
|
'роқ': 269,
|
||||||
|
'сто': 270,
|
||||||
|
'тин': 271,
|
||||||
|
'хат': 272,
|
||||||
|
'шир': 273,
|
||||||
|
' ав': 274,
|
||||||
|
' рў': 275,
|
||||||
|
' ту': 276,
|
||||||
|
' ўт': 277,
|
||||||
|
'а п': 278,
|
||||||
|
'авт': 279,
|
||||||
|
'ада': 280,
|
||||||
|
'аза': 281,
|
||||||
|
'анл': 282,
|
||||||
|
'б б': 283,
|
||||||
|
'бой': 284,
|
||||||
|
'бу ': 285,
|
||||||
|
'вто': 286,
|
||||||
|
'г э': 287,
|
||||||
|
'гин': 288,
|
||||||
|
'дар': 289,
|
||||||
|
'ден': 290,
|
||||||
|
'дун': 291,
|
||||||
|
'иде': 292,
|
||||||
|
'ион': 293,
|
||||||
|
'ирл': 294,
|
||||||
|
'ишг': 295,
|
||||||
|
'йха': 296,
|
||||||
|
'кел': 297,
|
||||||
|
'кўп': 298,
|
||||||
|
'лио': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/ve.py
Normal file
303
libs/guess_language/data/models/ve.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'ha ': 0,
|
||||||
|
' vh': 1,
|
||||||
|
'a m': 2,
|
||||||
|
'na ': 3,
|
||||||
|
' u ': 4,
|
||||||
|
'a n': 5,
|
||||||
|
'tsh': 6,
|
||||||
|
'wa ': 7,
|
||||||
|
'a u': 8,
|
||||||
|
' na': 9,
|
||||||
|
'nga': 10,
|
||||||
|
'vha': 11,
|
||||||
|
' ts': 12,
|
||||||
|
' dz': 13,
|
||||||
|
' kh': 14,
|
||||||
|
'dza': 15,
|
||||||
|
'a v': 16,
|
||||||
|
'ya ': 17,
|
||||||
|
' ya': 18,
|
||||||
|
'a t': 19,
|
||||||
|
'ho ': 20,
|
||||||
|
'la ': 21,
|
||||||
|
' zw': 22,
|
||||||
|
' mu': 23,
|
||||||
|
'edz': 24,
|
||||||
|
'vhu': 25,
|
||||||
|
'ga ': 26,
|
||||||
|
'shi': 27,
|
||||||
|
'za ': 28,
|
||||||
|
'a k': 29,
|
||||||
|
' ng': 30,
|
||||||
|
'kha': 31,
|
||||||
|
' ma': 32,
|
||||||
|
'hum': 33,
|
||||||
|
'ne ': 34,
|
||||||
|
' nd': 35,
|
||||||
|
'o n': 36,
|
||||||
|
'lo ': 37,
|
||||||
|
'dzi': 38,
|
||||||
|
'shu': 39,
|
||||||
|
' ha': 40,
|
||||||
|
'a d': 41,
|
||||||
|
'o y': 42,
|
||||||
|
'nda': 43,
|
||||||
|
'ele': 44,
|
||||||
|
'zwi': 45,
|
||||||
|
'aho': 46,
|
||||||
|
'ang': 47,
|
||||||
|
'no ': 48,
|
||||||
|
' a ': 49,
|
||||||
|
'ela': 50,
|
||||||
|
'a z': 51,
|
||||||
|
'hu ': 52,
|
||||||
|
'sha': 53,
|
||||||
|
'i n': 54,
|
||||||
|
' wa': 55,
|
||||||
|
'ana': 56,
|
||||||
|
'hi ': 57,
|
||||||
|
'kan': 58,
|
||||||
|
'o d': 59,
|
||||||
|
'ano': 60,
|
||||||
|
'a h': 61,
|
||||||
|
'zwa': 62,
|
||||||
|
' th': 63,
|
||||||
|
' mi': 64,
|
||||||
|
'gan': 65,
|
||||||
|
'a l': 66,
|
||||||
|
'sa ': 67,
|
||||||
|
'han': 68,
|
||||||
|
'di ': 69,
|
||||||
|
'u t': 70,
|
||||||
|
'and': 71,
|
||||||
|
'ndi': 72,
|
||||||
|
'yo ': 73,
|
||||||
|
'the': 74,
|
||||||
|
'do ': 75,
|
||||||
|
'ri ': 76,
|
||||||
|
'vho': 77,
|
||||||
|
'ni ': 78,
|
||||||
|
'ka ': 79,
|
||||||
|
'uri': 80,
|
||||||
|
'si ': 81,
|
||||||
|
'o t': 82,
|
||||||
|
'mbe': 83,
|
||||||
|
'o w': 84,
|
||||||
|
'ane': 85,
|
||||||
|
'we ': 86,
|
||||||
|
'zo ': 87,
|
||||||
|
'i t': 88,
|
||||||
|
'e n': 89,
|
||||||
|
'i h': 90,
|
||||||
|
'she': 91,
|
||||||
|
'ush': 92,
|
||||||
|
'o k': 93,
|
||||||
|
'zi ': 94,
|
||||||
|
'da ': 95,
|
||||||
|
'a a': 96,
|
||||||
|
'thu': 97,
|
||||||
|
' la': 98,
|
||||||
|
'a p': 99,
|
||||||
|
'zan': 100,
|
||||||
|
' i ': 101,
|
||||||
|
'a s': 102,
|
||||||
|
'lwa': 103,
|
||||||
|
'ula': 104,
|
||||||
|
'i d': 105,
|
||||||
|
'aka': 106,
|
||||||
|
' do': 107,
|
||||||
|
'mis': 108,
|
||||||
|
'hed': 109,
|
||||||
|
'ita': 110,
|
||||||
|
'li ': 111,
|
||||||
|
' hu': 112,
|
||||||
|
'iwa': 113,
|
||||||
|
' lu': 114,
|
||||||
|
'i v': 115,
|
||||||
|
'he ': 116,
|
||||||
|
' ka': 117,
|
||||||
|
'elo': 118,
|
||||||
|
'so ': 119,
|
||||||
|
'amb': 120,
|
||||||
|
'avh': 121,
|
||||||
|
' sh': 122,
|
||||||
|
'o v': 123,
|
||||||
|
'i k': 124,
|
||||||
|
'lel': 125,
|
||||||
|
'u v': 126,
|
||||||
|
'dzo': 127,
|
||||||
|
'u s': 128,
|
||||||
|
' fh': 129,
|
||||||
|
'mo ': 130,
|
||||||
|
'nwe': 131,
|
||||||
|
'o l': 132,
|
||||||
|
'umi': 133,
|
||||||
|
'wah': 134,
|
||||||
|
'isi': 135,
|
||||||
|
'hel': 136,
|
||||||
|
'a i': 137,
|
||||||
|
'vel': 138,
|
||||||
|
'adz': 139,
|
||||||
|
'tan': 140,
|
||||||
|
'i m': 141,
|
||||||
|
'ath': 142,
|
||||||
|
'thi': 143,
|
||||||
|
'wi ': 144,
|
||||||
|
' ur': 145,
|
||||||
|
'hat': 146,
|
||||||
|
'ine': 147,
|
||||||
|
'le ': 148,
|
||||||
|
'vhe': 149,
|
||||||
|
'any': 150,
|
||||||
|
'a y': 151,
|
||||||
|
'hon': 152,
|
||||||
|
'isa': 153,
|
||||||
|
'ala': 154,
|
||||||
|
'o a': 155,
|
||||||
|
'alu': 156,
|
||||||
|
'udi': 157,
|
||||||
|
'umb': 158,
|
||||||
|
' bv': 159,
|
||||||
|
'ash': 160,
|
||||||
|
' te': 161,
|
||||||
|
' li': 162,
|
||||||
|
'lus': 163,
|
||||||
|
'nya': 164,
|
||||||
|
'has': 165,
|
||||||
|
'led': 166,
|
||||||
|
'swa': 167,
|
||||||
|
'hus': 168,
|
||||||
|
'o i': 169,
|
||||||
|
'umo': 170,
|
||||||
|
'one': 171,
|
||||||
|
'nde': 172,
|
||||||
|
'tha': 173,
|
||||||
|
' it': 174,
|
||||||
|
'kho': 175,
|
||||||
|
'ngo': 176,
|
||||||
|
'mus': 177,
|
||||||
|
'hak': 178,
|
||||||
|
'e y': 179,
|
||||||
|
'ea ': 180,
|
||||||
|
'ivh': 181,
|
||||||
|
'o m': 182,
|
||||||
|
'u n': 183,
|
||||||
|
'hin': 184,
|
||||||
|
'tho': 185,
|
||||||
|
'mut': 186,
|
||||||
|
'ayo': 187,
|
||||||
|
'fhi': 188,
|
||||||
|
' sa': 189,
|
||||||
|
'tel': 190,
|
||||||
|
'hul': 191,
|
||||||
|
'hun': 192,
|
||||||
|
'ulo': 193,
|
||||||
|
'ith': 194,
|
||||||
|
'ma ': 195,
|
||||||
|
' yo': 196,
|
||||||
|
'lan': 197,
|
||||||
|
'e v': 198,
|
||||||
|
' ph': 199,
|
||||||
|
'go ': 200,
|
||||||
|
'i a': 201,
|
||||||
|
'o u': 202,
|
||||||
|
'hud': 203,
|
||||||
|
' pf': 204,
|
||||||
|
'uka': 205,
|
||||||
|
'zhi': 206,
|
||||||
|
'uvh': 207,
|
||||||
|
'dzw': 208,
|
||||||
|
'ing': 209,
|
||||||
|
'elw': 210,
|
||||||
|
'ila': 211,
|
||||||
|
'wo ': 212,
|
||||||
|
'mbo': 213,
|
||||||
|
'u d': 214,
|
||||||
|
'ite': 215,
|
||||||
|
'isw': 216,
|
||||||
|
'asi': 217,
|
||||||
|
'e k': 218,
|
||||||
|
'ndu': 219,
|
||||||
|
'fhe': 220,
|
||||||
|
'o h': 221,
|
||||||
|
'mel': 222,
|
||||||
|
'u b': 223,
|
||||||
|
'ika': 224,
|
||||||
|
'bo ': 225,
|
||||||
|
'gud': 226,
|
||||||
|
'dzh': 227,
|
||||||
|
'kon': 228,
|
||||||
|
'ifh': 229,
|
||||||
|
' ta': 230,
|
||||||
|
'e d': 231,
|
||||||
|
'uth': 232,
|
||||||
|
' ho': 233,
|
||||||
|
'i z': 234,
|
||||||
|
'wan': 235,
|
||||||
|
'ulu': 236,
|
||||||
|
'mad': 237,
|
||||||
|
'inw': 238,
|
||||||
|
'oth': 239,
|
||||||
|
'ani': 240,
|
||||||
|
'dis': 241,
|
||||||
|
'wit': 242,
|
||||||
|
'ou ': 243,
|
||||||
|
'bve': 244,
|
||||||
|
'ets': 245,
|
||||||
|
'u i': 246,
|
||||||
|
'adi': 247,
|
||||||
|
'e m': 248,
|
||||||
|
'fha': 249,
|
||||||
|
'nah': 250,
|
||||||
|
'dal': 251,
|
||||||
|
'win': 252,
|
||||||
|
' si': 253,
|
||||||
|
'sho': 254,
|
||||||
|
' in': 255,
|
||||||
|
'yam': 256,
|
||||||
|
'lay': 257,
|
||||||
|
'eka': 258,
|
||||||
|
'a f': 259,
|
||||||
|
'i u': 260,
|
||||||
|
'end': 261,
|
||||||
|
'i y': 262,
|
||||||
|
'alo': 263,
|
||||||
|
'i l': 264,
|
||||||
|
'uso': 265,
|
||||||
|
'mul': 266,
|
||||||
|
'ta ': 267,
|
||||||
|
'del': 268,
|
||||||
|
'u k': 269,
|
||||||
|
' mb': 270,
|
||||||
|
'pha': 271,
|
||||||
|
' di': 272,
|
||||||
|
'dad': 273,
|
||||||
|
'ali': 274,
|
||||||
|
'o s': 275,
|
||||||
|
'pfu': 276,
|
||||||
|
'khw': 277,
|
||||||
|
'e a': 278,
|
||||||
|
' ko': 279,
|
||||||
|
' ne': 280,
|
||||||
|
'hen': 281,
|
||||||
|
'mas': 282,
|
||||||
|
'ume': 283,
|
||||||
|
'ini': 284,
|
||||||
|
'ish': 285,
|
||||||
|
'udz': 286,
|
||||||
|
'ira': 287,
|
||||||
|
'oni': 288,
|
||||||
|
'luk': 289,
|
||||||
|
'nel': 290,
|
||||||
|
'iso': 291,
|
||||||
|
'mba': 292,
|
||||||
|
'dzu': 293,
|
||||||
|
'hom': 294,
|
||||||
|
'i s': 295,
|
||||||
|
'zwo': 296,
|
||||||
|
'ngu': 297,
|
||||||
|
'ara': 298,
|
||||||
|
'unz': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/vi.py
Normal file
303
libs/guess_language/data/models/vi.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'ng ': 0,
|
||||||
|
' th': 1,
|
||||||
|
' ch': 2,
|
||||||
|
'g t': 3,
|
||||||
|
' nh': 4,
|
||||||
|
'ông': 5,
|
||||||
|
' kh': 6,
|
||||||
|
' tr': 7,
|
||||||
|
'nh ': 8,
|
||||||
|
' cô': 9,
|
||||||
|
'côn': 10,
|
||||||
|
' ty': 11,
|
||||||
|
'ty ': 12,
|
||||||
|
'i t': 13,
|
||||||
|
'n t': 14,
|
||||||
|
' ng': 15,
|
||||||
|
'ại ': 16,
|
||||||
|
' ti': 17,
|
||||||
|
'ch ': 18,
|
||||||
|
'y l': 19,
|
||||||
|
'ền ': 20,
|
||||||
|
' đư': 21,
|
||||||
|
'hi ': 22,
|
||||||
|
' gở': 23,
|
||||||
|
'gởi': 24,
|
||||||
|
'iền': 25,
|
||||||
|
'tiề': 26,
|
||||||
|
'ởi ': 27,
|
||||||
|
' gi': 28,
|
||||||
|
' le': 29,
|
||||||
|
' vi': 30,
|
||||||
|
'cho': 31,
|
||||||
|
'ho ': 32,
|
||||||
|
'khá': 33,
|
||||||
|
' và': 34,
|
||||||
|
'hác': 35,
|
||||||
|
' ph': 36,
|
||||||
|
'am ': 37,
|
||||||
|
'hàn': 38,
|
||||||
|
'ách': 39,
|
||||||
|
'ôi ': 40,
|
||||||
|
'i n': 41,
|
||||||
|
'ược': 42,
|
||||||
|
'ợc ': 43,
|
||||||
|
' tô': 44,
|
||||||
|
'chú': 45,
|
||||||
|
'iệt': 46,
|
||||||
|
'tôi': 47,
|
||||||
|
'ên ': 48,
|
||||||
|
'úng': 49,
|
||||||
|
'ệt ': 50,
|
||||||
|
' có': 51,
|
||||||
|
'c t': 52,
|
||||||
|
'có ': 53,
|
||||||
|
'hún': 54,
|
||||||
|
'việ': 55,
|
||||||
|
'đượ': 56,
|
||||||
|
' na': 57,
|
||||||
|
'g c': 58,
|
||||||
|
'i c': 59,
|
||||||
|
'n c': 60,
|
||||||
|
'n n': 61,
|
||||||
|
't n': 62,
|
||||||
|
'và ': 63,
|
||||||
|
'n l': 64,
|
||||||
|
'n đ': 65,
|
||||||
|
'àng': 66,
|
||||||
|
'ác ': 67,
|
||||||
|
'ất ': 68,
|
||||||
|
'h l': 69,
|
||||||
|
'nam': 70,
|
||||||
|
'ân ': 71,
|
||||||
|
'ăm ': 72,
|
||||||
|
' hà': 73,
|
||||||
|
' là': 74,
|
||||||
|
' nă': 75,
|
||||||
|
' qu': 76,
|
||||||
|
' tạ': 77,
|
||||||
|
'g m': 78,
|
||||||
|
'năm': 79,
|
||||||
|
'tại': 80,
|
||||||
|
'ới ': 81,
|
||||||
|
' lẹ': 82,
|
||||||
|
'ay ': 83,
|
||||||
|
'e g': 84,
|
||||||
|
'h h': 85,
|
||||||
|
'i v': 86,
|
||||||
|
'i đ': 87,
|
||||||
|
'le ': 88,
|
||||||
|
'lẹ ': 89,
|
||||||
|
'ều ': 90,
|
||||||
|
'ời ': 91,
|
||||||
|
'hân': 92,
|
||||||
|
'nhi': 93,
|
||||||
|
't t': 94,
|
||||||
|
' củ': 95,
|
||||||
|
' mộ': 96,
|
||||||
|
' về': 97,
|
||||||
|
' đi': 98,
|
||||||
|
'an ': 99,
|
||||||
|
'của': 100,
|
||||||
|
'là ': 101,
|
||||||
|
'một': 102,
|
||||||
|
'về ': 103,
|
||||||
|
'ành': 104,
|
||||||
|
'ết ': 105,
|
||||||
|
'ột ': 106,
|
||||||
|
'ủa ': 107,
|
||||||
|
' bi': 108,
|
||||||
|
' cá': 109,
|
||||||
|
'a c': 110,
|
||||||
|
'anh': 111,
|
||||||
|
'các': 112,
|
||||||
|
'h c': 113,
|
||||||
|
'iều': 114,
|
||||||
|
'm t': 115,
|
||||||
|
'ện ': 116,
|
||||||
|
' ho': 117,
|
||||||
|
"'s ": 118,
|
||||||
|
'ave': 119,
|
||||||
|
"e's": 120,
|
||||||
|
'el ': 121,
|
||||||
|
'g n': 122,
|
||||||
|
"le'": 123,
|
||||||
|
'n v': 124,
|
||||||
|
'o c': 125,
|
||||||
|
'rav': 126,
|
||||||
|
's t': 127,
|
||||||
|
'thi': 128,
|
||||||
|
'tra': 129,
|
||||||
|
'vel': 130,
|
||||||
|
'ận ': 131,
|
||||||
|
'ến ': 132,
|
||||||
|
' ba': 133,
|
||||||
|
' cu': 134,
|
||||||
|
' sa': 135,
|
||||||
|
' đó': 136,
|
||||||
|
' đế': 137,
|
||||||
|
'c c': 138,
|
||||||
|
'chu': 139,
|
||||||
|
'hiề': 140,
|
||||||
|
'huy': 141,
|
||||||
|
'khi': 142,
|
||||||
|
'nhâ': 143,
|
||||||
|
'như': 144,
|
||||||
|
'ong': 145,
|
||||||
|
'ron': 146,
|
||||||
|
'thu': 147,
|
||||||
|
'thư': 148,
|
||||||
|
'tro': 149,
|
||||||
|
'y c': 150,
|
||||||
|
'ày ': 151,
|
||||||
|
'đến': 152,
|
||||||
|
'ười': 153,
|
||||||
|
'ườn': 154,
|
||||||
|
'ề v': 155,
|
||||||
|
'ờng': 156,
|
||||||
|
' vớ': 157,
|
||||||
|
'cuộ': 158,
|
||||||
|
'g đ': 159,
|
||||||
|
'iết': 160,
|
||||||
|
'iện': 161,
|
||||||
|
'ngà': 162,
|
||||||
|
'o t': 163,
|
||||||
|
'u c': 164,
|
||||||
|
'uộc': 165,
|
||||||
|
'với': 166,
|
||||||
|
'à c': 167,
|
||||||
|
'ài ': 168,
|
||||||
|
'ơng': 169,
|
||||||
|
'ươn': 170,
|
||||||
|
'ải ': 171,
|
||||||
|
'ộc ': 172,
|
||||||
|
'ức ': 173,
|
||||||
|
' an': 174,
|
||||||
|
' lậ': 175,
|
||||||
|
' ra': 176,
|
||||||
|
' sẽ': 177,
|
||||||
|
' số': 178,
|
||||||
|
' tổ': 179,
|
||||||
|
'a k': 180,
|
||||||
|
'biế': 181,
|
||||||
|
'c n': 182,
|
||||||
|
'c đ': 183,
|
||||||
|
'chứ': 184,
|
||||||
|
'g v': 185,
|
||||||
|
'gia': 186,
|
||||||
|
'gày': 187,
|
||||||
|
'hán': 188,
|
||||||
|
'hôn': 189,
|
||||||
|
'hư ': 190,
|
||||||
|
'hức': 191,
|
||||||
|
'i g': 192,
|
||||||
|
'i h': 193,
|
||||||
|
'i k': 194,
|
||||||
|
'i p': 195,
|
||||||
|
'iên': 196,
|
||||||
|
'khô': 197,
|
||||||
|
'lập': 198,
|
||||||
|
'n k': 199,
|
||||||
|
'ra ': 200,
|
||||||
|
'rên': 201,
|
||||||
|
'sẽ ': 202,
|
||||||
|
't c': 203,
|
||||||
|
'thà': 204,
|
||||||
|
'trê': 205,
|
||||||
|
'tổ ': 206,
|
||||||
|
'u n': 207,
|
||||||
|
'y t': 208,
|
||||||
|
'ình': 209,
|
||||||
|
'ấy ': 210,
|
||||||
|
'ập ': 211,
|
||||||
|
'ổ c': 212,
|
||||||
|
' má': 213,
|
||||||
|
' để': 214,
|
||||||
|
'ai ': 215,
|
||||||
|
'c s': 216,
|
||||||
|
'gườ': 217,
|
||||||
|
'h v': 218,
|
||||||
|
'hoa': 219,
|
||||||
|
'hoạ': 220,
|
||||||
|
'inh': 221,
|
||||||
|
'm n': 222,
|
||||||
|
'máy': 223,
|
||||||
|
'n g': 224,
|
||||||
|
'ngư': 225,
|
||||||
|
'nhậ': 226,
|
||||||
|
'o n': 227,
|
||||||
|
'oa ': 228,
|
||||||
|
'oàn': 229,
|
||||||
|
'p c': 230,
|
||||||
|
'số ': 231,
|
||||||
|
't đ': 232,
|
||||||
|
'y v': 233,
|
||||||
|
'ào ': 234,
|
||||||
|
'áy ': 235,
|
||||||
|
'ăn ': 236,
|
||||||
|
'đó ': 237,
|
||||||
|
'để ': 238,
|
||||||
|
'ước': 239,
|
||||||
|
'ần ': 240,
|
||||||
|
'ển ': 241,
|
||||||
|
'ớc ': 242,
|
||||||
|
' bá': 243,
|
||||||
|
' cơ': 244,
|
||||||
|
' cả': 245,
|
||||||
|
' cầ': 246,
|
||||||
|
' họ': 247,
|
||||||
|
' kỳ': 248,
|
||||||
|
' li': 249,
|
||||||
|
' mạ': 250,
|
||||||
|
' sở': 251,
|
||||||
|
' tặ': 252,
|
||||||
|
' vé': 253,
|
||||||
|
' vụ': 254,
|
||||||
|
' đạ': 255,
|
||||||
|
'a đ': 256,
|
||||||
|
'bay': 257,
|
||||||
|
'cơ ': 258,
|
||||||
|
'g s': 259,
|
||||||
|
'han': 260,
|
||||||
|
'hươ': 261,
|
||||||
|
'i s': 262,
|
||||||
|
'kỳ ': 263,
|
||||||
|
'm c': 264,
|
||||||
|
'n m': 265,
|
||||||
|
'n p': 266,
|
||||||
|
'o b': 267,
|
||||||
|
'oại': 268,
|
||||||
|
'qua': 269,
|
||||||
|
'sở ': 270,
|
||||||
|
'tha': 271,
|
||||||
|
'thá': 272,
|
||||||
|
'tặn': 273,
|
||||||
|
'vào': 274,
|
||||||
|
'vé ': 275,
|
||||||
|
'vụ ': 276,
|
||||||
|
'y b': 277,
|
||||||
|
'àn ': 278,
|
||||||
|
'áng': 279,
|
||||||
|
'ơ s': 280,
|
||||||
|
'ầu ': 281,
|
||||||
|
'ật ': 282,
|
||||||
|
'ặng': 283,
|
||||||
|
'ọc ': 284,
|
||||||
|
'ở t': 285,
|
||||||
|
'ững': 286,
|
||||||
|
' du': 287,
|
||||||
|
' lu': 288,
|
||||||
|
' ta': 289,
|
||||||
|
' to': 290,
|
||||||
|
' từ': 291,
|
||||||
|
' ở ': 292,
|
||||||
|
'a v': 293,
|
||||||
|
'ao ': 294,
|
||||||
|
'c v': 295,
|
||||||
|
'cả ': 296,
|
||||||
|
'du ': 297,
|
||||||
|
'g l': 298,
|
||||||
|
'giả': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/xh.py
Normal file
303
libs/guess_language/data/models/xh.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'la ': 0,
|
||||||
|
' ku': 1,
|
||||||
|
'lo ': 2,
|
||||||
|
'nga': 3,
|
||||||
|
'a k': 4,
|
||||||
|
' ng': 5,
|
||||||
|
'oku': 6,
|
||||||
|
' kw': 7,
|
||||||
|
' uk': 8,
|
||||||
|
'a n': 9,
|
||||||
|
'uku': 10,
|
||||||
|
'ye ': 11,
|
||||||
|
'a i': 12,
|
||||||
|
'yo ': 13,
|
||||||
|
'ela': 14,
|
||||||
|
'ele': 15,
|
||||||
|
'a u': 16,
|
||||||
|
'nye': 17,
|
||||||
|
'we ': 18,
|
||||||
|
'wa ': 19,
|
||||||
|
'ama': 20,
|
||||||
|
'e n': 21,
|
||||||
|
'ise': 22,
|
||||||
|
'aba': 23,
|
||||||
|
'ba ': 24,
|
||||||
|
'ho ': 25,
|
||||||
|
'enz': 26,
|
||||||
|
'o n': 27,
|
||||||
|
'ngo': 28,
|
||||||
|
'kub': 29,
|
||||||
|
'nge': 30,
|
||||||
|
'ath': 31,
|
||||||
|
'fun': 32,
|
||||||
|
'o e': 33,
|
||||||
|
'lel': 34,
|
||||||
|
'ung': 35,
|
||||||
|
'uba': 36,
|
||||||
|
'ko ': 37,
|
||||||
|
'elo': 38,
|
||||||
|
'ezi': 39,
|
||||||
|
'o k': 40,
|
||||||
|
'the': 41,
|
||||||
|
'kwa': 42,
|
||||||
|
'na ': 43,
|
||||||
|
'kwe': 44,
|
||||||
|
'ang': 45,
|
||||||
|
'e i': 46,
|
||||||
|
'le ': 47,
|
||||||
|
'ka ': 48,
|
||||||
|
'esi': 49,
|
||||||
|
'o y': 50,
|
||||||
|
' na': 51,
|
||||||
|
'e k': 52,
|
||||||
|
'eth': 53,
|
||||||
|
'pha': 54,
|
||||||
|
' in': 55,
|
||||||
|
'kun': 56,
|
||||||
|
'nzi': 57,
|
||||||
|
'and': 58,
|
||||||
|
'ni ': 59,
|
||||||
|
'ban': 60,
|
||||||
|
' ye': 61,
|
||||||
|
' no': 62,
|
||||||
|
'lwa': 63,
|
||||||
|
'lun': 64,
|
||||||
|
' ok': 65,
|
||||||
|
'any': 66,
|
||||||
|
'zi ': 67,
|
||||||
|
'li ': 68,
|
||||||
|
' ne': 69,
|
||||||
|
'ulu': 70,
|
||||||
|
'a e': 71,
|
||||||
|
'eli': 72,
|
||||||
|
'gok': 73,
|
||||||
|
'o l': 74,
|
||||||
|
'ebe': 75,
|
||||||
|
'und': 76,
|
||||||
|
'isa': 77,
|
||||||
|
'seb': 78,
|
||||||
|
'ndo': 79,
|
||||||
|
' ez': 80,
|
||||||
|
'tho': 81,
|
||||||
|
'o i': 82,
|
||||||
|
'do ': 83,
|
||||||
|
'ben': 84,
|
||||||
|
'ing': 85,
|
||||||
|
'kwi': 86,
|
||||||
|
'ndl': 87,
|
||||||
|
'uny': 88,
|
||||||
|
'ala': 89,
|
||||||
|
'a a': 90,
|
||||||
|
'eyo': 91,
|
||||||
|
'e u': 92,
|
||||||
|
'kan': 93,
|
||||||
|
' ab': 94,
|
||||||
|
'thi': 95,
|
||||||
|
'i k': 96,
|
||||||
|
'i n': 97,
|
||||||
|
'o u': 98,
|
||||||
|
'o z': 99,
|
||||||
|
'elw': 100,
|
||||||
|
'sa ': 101,
|
||||||
|
'sek': 102,
|
||||||
|
'ayo': 103,
|
||||||
|
'het': 104,
|
||||||
|
'o o': 105,
|
||||||
|
'eka': 106,
|
||||||
|
' um': 107,
|
||||||
|
'hi ': 108,
|
||||||
|
'bo ': 109,
|
||||||
|
'so ': 110,
|
||||||
|
'isi': 111,
|
||||||
|
'wen': 112,
|
||||||
|
'lwe': 113,
|
||||||
|
'aph': 114,
|
||||||
|
'a l': 115,
|
||||||
|
'ya ': 116,
|
||||||
|
'eko': 117,
|
||||||
|
'ana': 118,
|
||||||
|
' yo': 119,
|
||||||
|
'kuf': 120,
|
||||||
|
'ini': 121,
|
||||||
|
'imi': 122,
|
||||||
|
'ali': 123,
|
||||||
|
'ha ': 124,
|
||||||
|
'awu': 125,
|
||||||
|
'wan': 126,
|
||||||
|
'ent': 127,
|
||||||
|
'uth': 128,
|
||||||
|
'tha': 129,
|
||||||
|
'za ': 130,
|
||||||
|
'ula': 131,
|
||||||
|
'kho': 132,
|
||||||
|
' ii': 133,
|
||||||
|
'ane': 134,
|
||||||
|
'e a': 135,
|
||||||
|
'iso': 136,
|
||||||
|
'uph': 137,
|
||||||
|
' le': 138,
|
||||||
|
'ile': 139,
|
||||||
|
'zin': 140,
|
||||||
|
'nts': 141,
|
||||||
|
' si': 142,
|
||||||
|
'eng': 143,
|
||||||
|
'nok': 144,
|
||||||
|
'ong': 145,
|
||||||
|
'hla': 146,
|
||||||
|
'zwe': 147,
|
||||||
|
' el': 148,
|
||||||
|
'oka': 149,
|
||||||
|
'eki': 150,
|
||||||
|
'lis': 151,
|
||||||
|
'azi': 152,
|
||||||
|
' lo': 153,
|
||||||
|
'tsh': 154,
|
||||||
|
' am': 155,
|
||||||
|
'ufu': 156,
|
||||||
|
'ant': 157,
|
||||||
|
'isw': 158,
|
||||||
|
'o a': 159,
|
||||||
|
'ngu': 160,
|
||||||
|
'o s': 161,
|
||||||
|
' ba': 162,
|
||||||
|
'int': 163,
|
||||||
|
'eni': 164,
|
||||||
|
'une': 165,
|
||||||
|
'wul': 166,
|
||||||
|
'hul': 167,
|
||||||
|
'sel': 168,
|
||||||
|
'i e': 169,
|
||||||
|
'use': 170,
|
||||||
|
'lan': 171,
|
||||||
|
'ke ': 172,
|
||||||
|
'nis': 173,
|
||||||
|
'emi': 174,
|
||||||
|
' li': 175,
|
||||||
|
' is': 176,
|
||||||
|
'iph': 177,
|
||||||
|
' im': 178,
|
||||||
|
'a o': 179,
|
||||||
|
'aka': 180,
|
||||||
|
'mfu': 181,
|
||||||
|
' zi': 182,
|
||||||
|
'ink': 183,
|
||||||
|
'mal': 184,
|
||||||
|
'ley': 185,
|
||||||
|
'man': 186,
|
||||||
|
'nya': 187,
|
||||||
|
'nek': 188,
|
||||||
|
'akh': 189,
|
||||||
|
'ume': 190,
|
||||||
|
' ko': 191,
|
||||||
|
'alo': 192,
|
||||||
|
'tu ': 193,
|
||||||
|
'i u': 194,
|
||||||
|
'ntu': 195,
|
||||||
|
'izw': 196,
|
||||||
|
'kel': 197,
|
||||||
|
'izi': 198,
|
||||||
|
'i i': 199,
|
||||||
|
'si ': 200,
|
||||||
|
'gan': 201,
|
||||||
|
'ase': 202,
|
||||||
|
'ind': 203,
|
||||||
|
'i a': 204,
|
||||||
|
'ndi': 205,
|
||||||
|
'nel': 206,
|
||||||
|
'alu': 207,
|
||||||
|
'sis': 208,
|
||||||
|
'ubo': 209,
|
||||||
|
'kut': 210,
|
||||||
|
'mth': 211,
|
||||||
|
'kus': 212,
|
||||||
|
'lek': 213,
|
||||||
|
'mis': 214,
|
||||||
|
'nde': 215,
|
||||||
|
' zo': 216,
|
||||||
|
' we': 217,
|
||||||
|
'ani': 218,
|
||||||
|
'ga ': 219,
|
||||||
|
'iko': 220,
|
||||||
|
'siz': 221,
|
||||||
|
'no ': 222,
|
||||||
|
'phu': 223,
|
||||||
|
'e e': 224,
|
||||||
|
'hon': 225,
|
||||||
|
'ond': 226,
|
||||||
|
'ne ': 227,
|
||||||
|
'ith': 228,
|
||||||
|
'kul': 229,
|
||||||
|
'gam': 230,
|
||||||
|
'gen': 231,
|
||||||
|
'pho': 232,
|
||||||
|
' iz': 233,
|
||||||
|
'phe': 234,
|
||||||
|
'hat': 235,
|
||||||
|
'khu': 236,
|
||||||
|
'iin': 237,
|
||||||
|
'han': 238,
|
||||||
|
'zo ': 239,
|
||||||
|
'lu ': 240,
|
||||||
|
'ulo': 241,
|
||||||
|
'nda': 242,
|
||||||
|
'qo ': 243,
|
||||||
|
'zik': 244,
|
||||||
|
'hel': 245,
|
||||||
|
'o m': 246,
|
||||||
|
' lw': 247,
|
||||||
|
'zis': 248,
|
||||||
|
'dle': 249,
|
||||||
|
'uhl': 250,
|
||||||
|
'men': 251,
|
||||||
|
'olo': 252,
|
||||||
|
'mel': 253,
|
||||||
|
'del': 254,
|
||||||
|
'nza': 255,
|
||||||
|
'oko': 256,
|
||||||
|
'okw': 257,
|
||||||
|
'olu': 258,
|
||||||
|
'kuk': 259,
|
||||||
|
'nte': 260,
|
||||||
|
'swa': 261,
|
||||||
|
'law': 262,
|
||||||
|
'enk': 263,
|
||||||
|
' ya': 264,
|
||||||
|
'i y': 265,
|
||||||
|
'gaq': 266,
|
||||||
|
'sha': 267,
|
||||||
|
'aqo': 268,
|
||||||
|
'e l': 269,
|
||||||
|
'ikh': 270,
|
||||||
|
'nkq': 271,
|
||||||
|
'ule': 272,
|
||||||
|
' ka': 273,
|
||||||
|
'onk': 274,
|
||||||
|
'thu': 275,
|
||||||
|
'wo ': 276,
|
||||||
|
'bon': 277,
|
||||||
|
'kup': 278,
|
||||||
|
'qub': 279,
|
||||||
|
'a y': 280,
|
||||||
|
'kqu': 281,
|
||||||
|
'dla': 282,
|
||||||
|
' es': 283,
|
||||||
|
'he ': 284,
|
||||||
|
'ano': 285,
|
||||||
|
'lum': 286,
|
||||||
|
'be ': 287,
|
||||||
|
'iga': 288,
|
||||||
|
' ze': 289,
|
||||||
|
'o w': 290,
|
||||||
|
'aku': 291,
|
||||||
|
'mga': 292,
|
||||||
|
'nke': 293,
|
||||||
|
'te ': 294,
|
||||||
|
' ol': 295,
|
||||||
|
'ze ': 296,
|
||||||
|
'kum': 297,
|
||||||
|
'emf': 298,
|
||||||
|
'esh': 299,
|
||||||
|
}
|
303
libs/guess_language/data/models/zu.py
Normal file
303
libs/guess_language/data/models/zu.py
Normal file
|
@ -0,0 +1,303 @@
|
||||||
|
# -*- coding: utf-8 -*-
|
||||||
|
model = {
|
||||||
|
'oku': 0,
|
||||||
|
'la ': 1,
|
||||||
|
'nga': 2,
|
||||||
|
' ng': 3,
|
||||||
|
'a n': 4,
|
||||||
|
' ku': 5,
|
||||||
|
'a k': 6,
|
||||||
|
'thi': 7,
|
||||||
|
' uk': 8,
|
||||||
|
'ezi': 9,
|
||||||
|
'e n': 10,
|
||||||
|
'uku': 11,
|
||||||
|
'le ': 12,
|
||||||
|
'lo ': 13,
|
||||||
|
'hi ': 14,
|
||||||
|
'wa ': 15,
|
||||||
|
' no': 16,
|
||||||
|
'a u': 17,
|
||||||
|
'ela': 18,
|
||||||
|
'we ': 19,
|
||||||
|
'a i': 20,
|
||||||
|
'ni ': 21,
|
||||||
|
'ele': 22,
|
||||||
|
'zin': 23,
|
||||||
|
'uth': 24,
|
||||||
|
'ama': 25,
|
||||||
|
'elo': 26,
|
||||||
|
'pha': 27,
|
||||||
|
'ing': 28,
|
||||||
|
'aba': 29,
|
||||||
|
'ath': 30,
|
||||||
|
'and': 31,
|
||||||
|
'enz': 32,
|
||||||
|
'eth': 33,
|
||||||
|
'esi': 34,
|
||||||
|
'ma ': 35,
|
||||||
|
'lel': 36,
|
||||||
|
' um': 37,
|
||||||
|
' ka': 38,
|
||||||
|
'the': 39,
|
||||||
|
'ung': 40,
|
||||||
|
'nge': 41,
|
||||||
|
'ngo': 42,
|
||||||
|
'tho': 43,
|
||||||
|
'nye': 44,
|
||||||
|
'kwe': 45,
|
||||||
|
'eni': 46,
|
||||||
|
'izi': 47,
|
||||||
|
'ye ': 48,
|
||||||
|
' kw': 49,
|
||||||
|
'ndl': 50,
|
||||||
|
'ho ': 51,
|
||||||
|
'a e': 52,
|
||||||
|
'na ': 53,
|
||||||
|
'zi ': 54,
|
||||||
|
'het': 55,
|
||||||
|
'kan': 56,
|
||||||
|
'e u': 57,
|
||||||
|
'e i': 58,
|
||||||
|
'und': 59,
|
||||||
|
'ise': 60,
|
||||||
|
'isi': 61,
|
||||||
|
'nda': 62,
|
||||||
|
'kha': 63,
|
||||||
|
'ba ': 64,
|
||||||
|
'i k': 65,
|
||||||
|
'nom': 66,
|
||||||
|
'fun': 67,
|
||||||
|
' ez': 68,
|
||||||
|
' iz': 69,
|
||||||
|
'ke ': 70,
|
||||||
|
'ben': 71,
|
||||||
|
'o e': 72,
|
||||||
|
'isa': 73,
|
||||||
|
'zwe': 74,
|
||||||
|
'kel': 75,
|
||||||
|
'ka ': 76,
|
||||||
|
'aka': 77,
|
||||||
|
'nzi': 78,
|
||||||
|
'o n': 79,
|
||||||
|
'e k': 80,
|
||||||
|
'oma': 81,
|
||||||
|
'kwa': 82,
|
||||||
|
' ne': 83,
|
||||||
|
'any': 84,
|
||||||
|
'ang': 85,
|
||||||
|
'hla': 86,
|
||||||
|
'i u': 87,
|
||||||
|
'mth': 88,
|
||||||
|
'kub': 89,
|
||||||
|
'o k': 90,
|
||||||
|
'ana': 91,
|
||||||
|
'ane': 92,
|
||||||
|
'ikh': 93,
|
||||||
|
'ebe': 94,
|
||||||
|
'kut': 95,
|
||||||
|
'ha ': 96,
|
||||||
|
' is': 97,
|
||||||
|
'azi': 98,
|
||||||
|
'ulu': 99,
|
||||||
|
'seb': 100,
|
||||||
|
'ala': 101,
|
||||||
|
'onk': 102,
|
||||||
|
'ban': 103,
|
||||||
|
'i e': 104,
|
||||||
|
'azw': 105,
|
||||||
|
'wen': 106,
|
||||||
|
' ab': 107,
|
||||||
|
'han': 108,
|
||||||
|
'a a': 109,
|
||||||
|
'i n': 110,
|
||||||
|
'imi': 111,
|
||||||
|
'lan': 112,
|
||||||
|
'hat': 113,
|
||||||
|
'lwa': 114,
|
||||||
|
' na': 115,
|
||||||
|
'ini': 116,
|
||||||
|
'akh': 117,
|
||||||
|
'li ': 118,
|
||||||
|
'ngu': 119,
|
||||||
|
'nke': 120,
|
||||||
|
'nok': 121,
|
||||||
|
'ume': 122,
|
||||||
|
'eke': 123,
|
||||||
|
'elw': 124,
|
||||||
|
'yo ': 125,
|
||||||
|
'aph': 126,
|
||||||
|
'kus': 127,
|
||||||
|
' es': 128,
|
||||||
|
' ok': 129,
|
||||||
|
'iph': 130,
|
||||||
|
' im': 131,
|
||||||
|
'mel': 132,
|
||||||
|
'i i': 133,
|
||||||
|
' lo': 134,
|
||||||
|
' in': 135,
|
||||||
|
' am': 136,
|
||||||
|
'kho': 137,
|
||||||
|
'za ': 138,
|
||||||
|
'gok': 139,
|
||||||
|
'sek': 140,
|
||||||
|
'lun': 141,
|
||||||
|
'kun': 142,
|
||||||
|
'lwe': 143,
|
||||||
|
'sha': 144,
|
||||||
|
'sik': 145,
|
||||||
|
'kuf': 146,
|
||||||
|
'hak': 147,
|
||||||
|
'a y': 148,
|
||||||
|
'thu': 149,
|
||||||
|
'sa ': 150,
|
||||||
|
'o u': 151,
|
||||||
|
'khu': 152,
|
||||||
|
'ayo': 153,
|
||||||
|
'hul': 154,
|
||||||
|
'e a': 155,
|
||||||
|
'ali': 156,
|
||||||
|
'eng': 157,
|
||||||
|
'lu ': 158,
|
||||||
|
'ne ': 159,
|
||||||
|
' ko': 160,
|
||||||
|
'eli': 161,
|
||||||
|
'uba': 162,
|
||||||
|
'dle': 163,
|
||||||
|
'e e': 164,
|
||||||
|
'ith': 165,
|
||||||
|
' yo': 166,
|
||||||
|
'a l': 167,
|
||||||
|
'nel': 168,
|
||||||
|
'mis': 169,
|
||||||
|
' si': 170,
|
||||||
|
'kul': 171,
|
||||||
|
'a o': 172,
|
||||||
|
'sis': 173,
|
||||||
|
'lok': 174,
|
||||||
|
'gen': 175,
|
||||||
|
'o z': 176,
|
||||||
|
'i a': 177,
|
||||||
|
'emi': 178,
|
||||||
|
'uma': 179,
|
||||||
|
'eka': 180,
|
||||||
|
'alo': 181,
|
||||||
|
'man': 182,
|
||||||
|
'isw': 183,
|
||||||
|
'tha': 184,
|
||||||
|
'o i': 185,
|
||||||
|
'lon': 186,
|
||||||
|
'so ': 187,
|
||||||
|
'uph': 188,
|
||||||
|
'uhl': 189,
|
||||||
|
'ntu': 190,
|
||||||
|
'zim': 191,
|
||||||
|
'mal': 192,
|
||||||
|
'ind': 193,
|
||||||
|
'wez': 194,
|
||||||
|
' ba': 195,
|
||||||
|
'o o': 196,
|
||||||
|
' yi': 197,
|
||||||
|
' we': 198,
|
||||||
|
'ula': 199,
|
||||||
|
'phe': 200,
|
||||||
|
'o y': 201,
|
||||||
|
'ile': 202,
|
||||||
|
'o l': 203,
|
||||||
|
'wo ': 204,
|
||||||
|
'wel': 205,
|
||||||
|
'ga ': 206,
|
||||||
|
'tu ': 207,
|
||||||
|
'hle': 208,
|
||||||
|
'okw': 209,
|
||||||
|
'fan': 210,
|
||||||
|
' le': 211,
|
||||||
|
'kaz': 212,
|
||||||
|
'ase': 213,
|
||||||
|
'ani': 214,
|
||||||
|
'nde': 215,
|
||||||
|
'bo ': 216,
|
||||||
|
'ngi': 217,
|
||||||
|
'ule': 218,
|
||||||
|
' em': 219,
|
||||||
|
'men': 220,
|
||||||
|
'iny': 221,
|
||||||
|
'amb': 222,
|
||||||
|
'mbi': 223,
|
||||||
|
'gan': 224,
|
||||||
|
'ifu': 225,
|
||||||
|
'o s': 226,
|
||||||
|
'ant': 227,
|
||||||
|
'hel': 228,
|
||||||
|
'ika': 229,
|
||||||
|
'ona': 230,
|
||||||
|
'i l': 231,
|
||||||
|
'fut': 232,
|
||||||
|
' fu': 233,
|
||||||
|
'ze ': 234,
|
||||||
|
'u a': 235,
|
||||||
|
'nhl': 236,
|
||||||
|
'nin': 237,
|
||||||
|
' zo': 238,
|
||||||
|
'end': 239,
|
||||||
|
'sig': 240,
|
||||||
|
'u k': 241,
|
||||||
|
'gab': 242,
|
||||||
|
'ufa': 243,
|
||||||
|
'ish': 244,
|
||||||
|
'ush': 245,
|
||||||
|
'kuz': 246,
|
||||||
|
'no ': 247,
|
||||||
|
'gam': 248,
|
||||||
|
'kuh': 249,
|
||||||
|
' ye': 250,
|
||||||
|
'nya': 251,
|
||||||
|
'nez': 252,
|
||||||
|
'zis': 253,
|
||||||
|
'dlu': 254,
|
||||||
|
'kat': 255,
|
||||||
|
'dla': 256,
|
||||||
|
'tsh': 257,
|
||||||
|
' se': 258,
|
||||||
|
'ike': 259,
|
||||||
|
'kuq': 260,
|
||||||
|
'gu ': 261,
|
||||||
|
'osi': 262,
|
||||||
|
'swa': 263,
|
||||||
|
'lul': 264,
|
||||||
|
' zi': 265,
|
||||||
|
'ima': 266,
|
||||||
|
'e l': 267,
|
||||||
|
'kup': 268,
|
||||||
|
'mo ': 269,
|
||||||
|
'nza': 270,
|
||||||
|
'asi': 271,
|
||||||
|
'ko ': 272,
|
||||||
|
'kum': 273,
|
||||||
|
'lek': 274,
|
||||||
|
'she': 275,
|
||||||
|
'umt': 276,
|
||||||
|
'uny': 277,
|
||||||
|
'yok': 278,
|
||||||
|
'wan': 279,
|
||||||
|
'wam': 280,
|
||||||
|
'ame': 281,
|
||||||
|
'ong': 282,
|
||||||
|
'lis': 283,
|
||||||
|
'mkh': 284,
|
||||||
|
'ahl': 285,
|
||||||
|
'ale': 286,
|
||||||
|
'use': 287,
|
||||||
|
'o a': 288,
|
||||||
|
'alu': 289,
|
||||||
|
'gap': 290,
|
||||||
|
'si ': 291,
|
||||||
|
'hlo': 292,
|
||||||
|
'nje': 293,
|
||||||
|
'omt': 294,
|
||||||
|
'o w': 295,
|
||||||
|
'okh': 296,
|
||||||
|
'he ': 297,
|
||||||
|
'kom': 298,
|
||||||
|
'i s': 299,
|
||||||
|
}
|
|
@ -1 +0,0 @@
|
||||||
from .detector_factory import DetectorFactory, PROFILES_DIRECTORY, detect, detect_langs
|
|
|
@ -1,249 +0,0 @@
|
||||||
import random
|
|
||||||
import re
|
|
||||||
|
|
||||||
import six
|
|
||||||
from six.moves import zip, xrange
|
|
||||||
|
|
||||||
from .lang_detect_exception import ErrorCode, LangDetectException
|
|
||||||
from .language import Language
|
|
||||||
from .utils.ngram import NGram
|
|
||||||
from .utils.unicode_block import unicode_block
|
|
||||||
|
|
||||||
|
|
||||||
class Detector(object):
|
|
||||||
'''
|
|
||||||
Detector class is to detect language from specified text.
|
|
||||||
Its instance is able to be constructed via the factory class DetectorFactory.
|
|
||||||
|
|
||||||
After appending a target text to the Detector instance with .append(string),
|
|
||||||
the detector provides the language detection results for target text via .detect() or .get_probabilities().
|
|
||||||
|
|
||||||
.detect() method returns a single language name which has the highest probability.
|
|
||||||
.get_probabilities() methods returns a list of multiple languages and their probabilities.
|
|
||||||
|
|
||||||
The detector has some parameters for language detection.
|
|
||||||
See set_alpha(double), .set_max_text_length(int) .set_prior_map(dict).
|
|
||||||
|
|
||||||
Example:
|
|
||||||
|
|
||||||
from langdetect.detector_factory import DetectorFactory
|
|
||||||
factory = DetectorFactory()
|
|
||||||
factory.load_profile('/path/to/profile/directory')
|
|
||||||
|
|
||||||
def detect(text):
|
|
||||||
detector = factory.create()
|
|
||||||
detector.append(text)
|
|
||||||
return detector.detect()
|
|
||||||
|
|
||||||
def detect_langs(text):
|
|
||||||
detector = factory.create()
|
|
||||||
detector.append(text)
|
|
||||||
return detector.get_probabilities()
|
|
||||||
'''
|
|
||||||
|
|
||||||
ALPHA_DEFAULT = 0.5
|
|
||||||
ALPHA_WIDTH = 0.05
|
|
||||||
|
|
||||||
ITERATION_LIMIT = 1000
|
|
||||||
PROB_THRESHOLD = 0.1
|
|
||||||
CONV_THRESHOLD = 0.99999
|
|
||||||
BASE_FREQ = 10000
|
|
||||||
UNKNOWN_LANG = 'unknown'
|
|
||||||
|
|
||||||
URL_RE = re.compile(r'https?://[-_.?&~;+=/#0-9A-Za-z]{1,2076}')
|
|
||||||
MAIL_RE = re.compile(r'[-_.0-9A-Za-z]{1,64}@[-_0-9A-Za-z]{1,255}[-_.0-9A-Za-z]{1,255}')
|
|
||||||
|
|
||||||
def __init__(self, factory):
|
|
||||||
self.word_lang_prob_map = factory.word_lang_prob_map
|
|
||||||
self.langlist = factory.langlist
|
|
||||||
self.seed = factory.seed
|
|
||||||
self.random = random.Random()
|
|
||||||
self.text = ''
|
|
||||||
self.langprob = None
|
|
||||||
|
|
||||||
self.alpha = self.ALPHA_DEFAULT
|
|
||||||
self.n_trial = 7
|
|
||||||
self.max_text_length = 10000
|
|
||||||
self.prior_map = None
|
|
||||||
self.verbose = False
|
|
||||||
|
|
||||||
def set_verbose(self):
|
|
||||||
self.verbose = True
|
|
||||||
|
|
||||||
def set_alpha(self, alpha):
|
|
||||||
self.alpha = alpha
|
|
||||||
|
|
||||||
def set_prior_map(self, prior_map):
|
|
||||||
'''Set prior information about language probabilities.'''
|
|
||||||
self.prior_map = [0.0] * len(self.langlist)
|
|
||||||
sump = 0.0
|
|
||||||
for i in xrange(len(self.prior_map)):
|
|
||||||
lang = self.langlist[i]
|
|
||||||
if lang in prior_map:
|
|
||||||
p = prior_map[lang]
|
|
||||||
if p < 0:
|
|
||||||
raise LangDetectException(ErrorCode.InitParamError, 'Prior probability must be non-negative.')
|
|
||||||
self.prior_map[i] = p
|
|
||||||
sump += p
|
|
||||||
if sump <= 0.0:
|
|
||||||
raise LangDetectException(ErrorCode.InitParamError, 'More one of prior probability must be non-zero.')
|
|
||||||
for i in xrange(len(self.prior_map)):
|
|
||||||
self.prior_map[i] /= sump
|
|
||||||
|
|
||||||
def set_max_text_length(self, max_text_length):
|
|
||||||
'''Specify max size of target text to use for language detection.
|
|
||||||
The default value is 10000(10KB).
|
|
||||||
'''
|
|
||||||
self.max_text_length = max_text_length
|
|
||||||
|
|
||||||
def append(self, text):
|
|
||||||
'''Append the target text for language detection.
|
|
||||||
If the total size of target text exceeds the limit size specified by
|
|
||||||
Detector.set_max_text_length(int), the rest is cut down.
|
|
||||||
'''
|
|
||||||
text = self.URL_RE.sub(' ', text)
|
|
||||||
text = self.MAIL_RE.sub(' ', text)
|
|
||||||
text = NGram.normalize_vi(text)
|
|
||||||
pre = 0
|
|
||||||
for i in xrange(min(len(text), self.max_text_length)):
|
|
||||||
ch = text[i]
|
|
||||||
if ch != ' ' or pre != ' ':
|
|
||||||
self.text += ch
|
|
||||||
pre = ch
|
|
||||||
|
|
||||||
def cleaning_text(self):
|
|
||||||
'''Cleaning text to detect
|
|
||||||
(eliminate URL, e-mail address and Latin sentence if it is not written in Latin alphabet).
|
|
||||||
'''
|
|
||||||
latin_count, non_latin_count = 0, 0
|
|
||||||
for ch in self.text:
|
|
||||||
if 'A' <= ch <= 'z':
|
|
||||||
latin_count += 1
|
|
||||||
elif ch >= six.u('\u0300') and unicode_block(ch) != 'Latin Extended Additional':
|
|
||||||
non_latin_count += 1
|
|
||||||
|
|
||||||
if latin_count * 2 < non_latin_count:
|
|
||||||
text_without_latin = ''
|
|
||||||
for ch in self.text:
|
|
||||||
if ch < 'A' or 'z' < ch:
|
|
||||||
text_without_latin += ch
|
|
||||||
self.text = text_without_latin
|
|
||||||
|
|
||||||
def detect(self):
|
|
||||||
'''Detect language of the target text and return the language name
|
|
||||||
which has the highest probability.
|
|
||||||
'''
|
|
||||||
probabilities = self.get_probabilities()
|
|
||||||
if probabilities:
|
|
||||||
return probabilities[0].lang
|
|
||||||
return self.UNKNOWN_LANG
|
|
||||||
|
|
||||||
def get_probabilities(self):
|
|
||||||
if self.langprob is None:
|
|
||||||
self._detect_block()
|
|
||||||
return self._sort_probability(self.langprob)
|
|
||||||
|
|
||||||
def _detect_block(self):
|
|
||||||
self.cleaning_text()
|
|
||||||
ngrams = self._extract_ngrams()
|
|
||||||
if not ngrams:
|
|
||||||
raise LangDetectException(ErrorCode.CantDetectError, 'No features in text.')
|
|
||||||
|
|
||||||
self.langprob = [0.0] * len(self.langlist)
|
|
||||||
|
|
||||||
self.random.seed(self.seed)
|
|
||||||
for t in xrange(self.n_trial):
|
|
||||||
prob = self._init_probability()
|
|
||||||
alpha = self.alpha + self.random.gauss(0.0, 1.0) * self.ALPHA_WIDTH
|
|
||||||
|
|
||||||
i = 0
|
|
||||||
while True:
|
|
||||||
self._update_lang_prob(prob, self.random.choice(ngrams), alpha)
|
|
||||||
if i % 5 == 0:
|
|
||||||
if self._normalize_prob(prob) > self.CONV_THRESHOLD or i >= self.ITERATION_LIMIT:
|
|
||||||
break
|
|
||||||
if self.verbose:
|
|
||||||
six.print_('>', self._sort_probability(prob))
|
|
||||||
i += 1
|
|
||||||
for j in xrange(len(self.langprob)):
|
|
||||||
self.langprob[j] += prob[j] / self.n_trial
|
|
||||||
if self.verbose:
|
|
||||||
six.print_('==>', self._sort_probability(prob))
|
|
||||||
|
|
||||||
def _init_probability(self):
|
|
||||||
'''Initialize the map of language probabilities.
|
|
||||||
If there is the specified prior map, use it as initial map.
|
|
||||||
'''
|
|
||||||
if self.prior_map is not None:
|
|
||||||
return list(self.prior_map)
|
|
||||||
else:
|
|
||||||
return [1.0 / len(self.langlist)] * len(self.langlist)
|
|
||||||
|
|
||||||
def _extract_ngrams(self):
|
|
||||||
'''Extract n-grams from target text.'''
|
|
||||||
RANGE = list(xrange(1, NGram.N_GRAM + 1))
|
|
||||||
|
|
||||||
result = []
|
|
||||||
ngram = NGram()
|
|
||||||
for ch in self.text:
|
|
||||||
ngram.add_char(ch)
|
|
||||||
if ngram.capitalword:
|
|
||||||
continue
|
|
||||||
for n in RANGE:
|
|
||||||
# optimized w = ngram.get(n)
|
|
||||||
if len(ngram.grams) < n:
|
|
||||||
break
|
|
||||||
w = ngram.grams[-n:]
|
|
||||||
if w and w != ' ' and w in self.word_lang_prob_map:
|
|
||||||
result.append(w)
|
|
||||||
return result
|
|
||||||
|
|
||||||
def _update_lang_prob(self, prob, word, alpha):
|
|
||||||
'''Update language probabilities with N-gram string(N=1,2,3).'''
|
|
||||||
if word is None or word not in self.word_lang_prob_map:
|
|
||||||
return False
|
|
||||||
|
|
||||||
lang_prob_map = self.word_lang_prob_map[word]
|
|
||||||
if self.verbose:
|
|
||||||
six.print_('%s(%s): %s' % (word, self._unicode_encode(word), self._word_prob_to_string(lang_prob_map)))
|
|
||||||
|
|
||||||
weight = alpha / self.BASE_FREQ
|
|
||||||
for i in xrange(len(prob)):
|
|
||||||
prob[i] *= weight + lang_prob_map[i]
|
|
||||||
return True
|
|
||||||
|
|
||||||
def _word_prob_to_string(self, prob):
|
|
||||||
result = ''
|
|
||||||
for j in xrange(len(prob)):
|
|
||||||
p = prob[j]
|
|
||||||
if p >= 0.00001:
|
|
||||||
result += ' %s:%.5f' % (self.langlist[j], p)
|
|
||||||
return result
|
|
||||||
|
|
||||||
def _normalize_prob(self, prob):
|
|
||||||
'''Normalize probabilities and check convergence by the maximun probability.
|
|
||||||
'''
|
|
||||||
maxp, sump = 0.0, sum(prob)
|
|
||||||
for i in xrange(len(prob)):
|
|
||||||
p = prob[i] / sump
|
|
||||||
if maxp < p:
|
|
||||||
maxp = p
|
|
||||||
prob[i] = p
|
|
||||||
return maxp
|
|
||||||
|
|
||||||
def _sort_probability(self, prob):
|
|
||||||
result = [Language(lang, p) for (lang, p) in zip(self.langlist, prob) if p > self.PROB_THRESHOLD]
|
|
||||||
result.sort(reverse=True)
|
|
||||||
return result
|
|
||||||
|
|
||||||
def _unicode_encode(self, word):
|
|
||||||
buf = ''
|
|
||||||
for ch in word:
|
|
||||||
if ch >= six.u('\u0080'):
|
|
||||||
st = hex(0x10000 + ord(ch))[2:]
|
|
||||||
while len(st) < 4:
|
|
||||||
st = '0' + st
|
|
||||||
buf += r'\u' + st[1:5]
|
|
||||||
else:
|
|
||||||
buf += ch
|
|
||||||
return buf
|
|
|
@ -1,137 +0,0 @@
|
||||||
import os
|
|
||||||
from os import path
|
|
||||||
import sys
|
|
||||||
|
|
||||||
try:
|
|
||||||
import simplejson as json
|
|
||||||
except ImportError:
|
|
||||||
import json
|
|
||||||
|
|
||||||
from .detector import Detector
|
|
||||||
from .lang_detect_exception import ErrorCode, LangDetectException
|
|
||||||
from .utils.lang_profile import LangProfile
|
|
||||||
|
|
||||||
|
|
||||||
class DetectorFactory(object):
|
|
||||||
'''
|
|
||||||
Language Detector Factory Class.
|
|
||||||
|
|
||||||
This class manages an initialization and constructions of Detector.
|
|
||||||
|
|
||||||
Before using language detection library,
|
|
||||||
load profiles with DetectorFactory.load_profile(str)
|
|
||||||
and set initialization parameters.
|
|
||||||
|
|
||||||
When the language detection,
|
|
||||||
construct Detector instance via DetectorFactory.create().
|
|
||||||
See also Detector's sample code.
|
|
||||||
'''
|
|
||||||
seed = None
|
|
||||||
|
|
||||||
def __init__(self):
|
|
||||||
self.word_lang_prob_map = {}
|
|
||||||
self.langlist = []
|
|
||||||
|
|
||||||
def load_profile(self, profile_directory):
|
|
||||||
list_files = os.listdir(profile_directory)
|
|
||||||
if not list_files:
|
|
||||||
raise LangDetectException(ErrorCode.NeedLoadProfileError, 'Not found profile: ' + profile_directory)
|
|
||||||
|
|
||||||
langsize, index = len(list_files), 0
|
|
||||||
for filename in list_files:
|
|
||||||
if filename.startswith('.'):
|
|
||||||
continue
|
|
||||||
filename = path.join(profile_directory, filename)
|
|
||||||
if not path.isfile(filename):
|
|
||||||
continue
|
|
||||||
|
|
||||||
f = None
|
|
||||||
try:
|
|
||||||
if sys.version_info[0] < 3:
|
|
||||||
f = open(filename, 'r')
|
|
||||||
else:
|
|
||||||
f = open(filename, 'r', encoding='utf-8')
|
|
||||||
json_data = json.load(f)
|
|
||||||
profile = LangProfile(**json_data)
|
|
||||||
self.add_profile(profile, index, langsize)
|
|
||||||
index += 1
|
|
||||||
except IOError:
|
|
||||||
raise LangDetectException(ErrorCode.FileLoadError, 'Cannot open "%s"' % filename)
|
|
||||||
except:
|
|
||||||
raise LangDetectException(ErrorCode.FormatError, 'Profile format error in "%s"' % filename)
|
|
||||||
finally:
|
|
||||||
if f:
|
|
||||||
f.close()
|
|
||||||
|
|
||||||
def load_json_profile(self, json_profiles):
|
|
||||||
langsize, index = len(json_profiles), 0
|
|
||||||
if langsize < 2:
|
|
||||||
raise LangDetectException(ErrorCode.NeedLoadProfileError, 'Need more than 2 profiles.')
|
|
||||||
|
|
||||||
for json_profile in json_profiles:
|
|
||||||
try:
|
|
||||||
json_data = json.loads(json_profile)
|
|
||||||
profile = LangProfile(**json_data)
|
|
||||||
self.add_profile(profile, index, langsize)
|
|
||||||
index += 1
|
|
||||||
except:
|
|
||||||
raise LangDetectException(ErrorCode.FormatError, 'Profile format error.')
|
|
||||||
|
|
||||||
def add_profile(self, profile, index, langsize):
|
|
||||||
lang = profile.name
|
|
||||||
if lang in self.langlist:
|
|
||||||
raise LangDetectException(ErrorCode.DuplicateLangError, 'Duplicate the same language profile.')
|
|
||||||
self.langlist.append(lang)
|
|
||||||
|
|
||||||
for word in profile.freq:
|
|
||||||
if word not in self.word_lang_prob_map:
|
|
||||||
self.word_lang_prob_map[word] = [0.0] * langsize
|
|
||||||
length = len(word)
|
|
||||||
if 1 <= length <= 3:
|
|
||||||
prob = 1.0 * profile.freq.get(word) / profile.n_words[length - 1]
|
|
||||||
self.word_lang_prob_map[word][index] = prob
|
|
||||||
|
|
||||||
def clear(self):
|
|
||||||
self.langlist = []
|
|
||||||
self.word_lang_prob_map = {}
|
|
||||||
|
|
||||||
def create(self, alpha=None):
|
|
||||||
'''Construct Detector instance with smoothing parameter.'''
|
|
||||||
detector = self._create_detector()
|
|
||||||
if alpha is not None:
|
|
||||||
detector.set_alpha(alpha)
|
|
||||||
return detector
|
|
||||||
|
|
||||||
def _create_detector(self):
|
|
||||||
if not self.langlist:
|
|
||||||
raise LangDetectException(ErrorCode.NeedLoadProfileError, 'Need to load profiles.')
|
|
||||||
return Detector(self)
|
|
||||||
|
|
||||||
def set_seed(self, seed):
|
|
||||||
self.seed = seed
|
|
||||||
|
|
||||||
def get_lang_list(self):
|
|
||||||
return list(self.langlist)
|
|
||||||
|
|
||||||
|
|
||||||
PROFILES_DIRECTORY = path.join(path.dirname(__file__), 'profiles')
|
|
||||||
_factory = None
|
|
||||||
|
|
||||||
def init_factory():
|
|
||||||
global _factory
|
|
||||||
if _factory is None:
|
|
||||||
_factory = DetectorFactory()
|
|
||||||
_factory.load_profile(PROFILES_DIRECTORY)
|
|
||||||
|
|
||||||
def detect(text):
|
|
||||||
init_factory()
|
|
||||||
detector = _factory.create()
|
|
||||||
detector.append(text)
|
|
||||||
return detector.detect()
|
|
||||||
|
|
||||||
|
|
||||||
def detect_langs(text):
|
|
||||||
init_factory()
|
|
||||||
detector = _factory.create()
|
|
||||||
detector.append(text)
|
|
||||||
return detector.get_probabilities()
|
|
|
@ -1,22 +0,0 @@
|
||||||
_error_codes = {
|
|
||||||
'NoTextError': 0,
|
|
||||||
'FormatError': 1,
|
|
||||||
'FileLoadError': 2,
|
|
||||||
'DuplicateLangError': 3,
|
|
||||||
'NeedLoadProfileError': 4,
|
|
||||||
'CantDetectError': 5,
|
|
||||||
'CantOpenTrainData': 6,
|
|
||||||
'TrainDataFormatError': 7,
|
|
||||||
'InitParamError': 8,
|
|
||||||
}
|
|
||||||
|
|
||||||
ErrorCode = type('ErrorCode', (), _error_codes)
|
|
||||||
|
|
||||||
|
|
||||||
class LangDetectException(Exception):
|
|
||||||
def __init__(self, code, message):
|
|
||||||
super(LangDetectException, self).__init__(message)
|
|
||||||
self.code = code
|
|
||||||
|
|
||||||
def get_code(self):
|
|
||||||
return self.code
|
|
|
@ -1,17 +0,0 @@
|
||||||
class Language(object):
|
|
||||||
'''
|
|
||||||
Language is to store the detected language.
|
|
||||||
Detector.get_probabilities() returns a list of Languages.
|
|
||||||
'''
|
|
||||||
|
|
||||||
def __init__(self, lang, prob):
|
|
||||||
self.lang = lang
|
|
||||||
self.prob = prob
|
|
||||||
|
|
||||||
def __repr__(self):
|
|
||||||
if self.lang is None:
|
|
||||||
return ''
|
|
||||||
return '%s:%s' % (self.lang, self.prob)
|
|
||||||
|
|
||||||
def __lt__(self, other):
|
|
||||||
return self.prob < other.prob
|
|
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
File diff suppressed because one or more lines are too long
Some files were not shown because too many files have changed in this diff Show more
Loading…
Add table
Add a link
Reference in a new issue