Project information
Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum
(LINDAT-Clarin)
- Project Identification
- LM2010013
- Project Period
- 11/2010 - 12/2015
- Investor / Pogramme / Project type
-
Ministry of Education, Youth and Sports of the CR
- Large Infrastructures for Research, Development and Innovation
- MU Faculty or unit
- Faculty of Informatics
- Cooperating Organization
-
Institute of the Czech Language of the ASCR, v. v. i.
Charles University
- Responsible person Ing. Jana Kalinová, Ph.D.
- Responsible person prof. Ing. Jan Tříska, CSc.
Projekt LINDAT-Clarin bude napojen na projekt Clarin, ESFRI projekt (FP7-RI-2122230) pro jazykovou infrastrukturu v humanitních vědách (Common Language Resources and Technology Infrastructure)
Uzel Clarin bude realizován čtyřmi partnery projektu. Toto ZSPO bude realizovat organizačně i technologicky veškeré funkce uzlu (Centrum "A" v terminologii Clarin) pro budoucí asociaci Clarin-ERIC, a bude pověřeno výkonem funkcí MŠMT v Clarin-ERIC (kromě pravomocí rozhodovacích). Navrhovaným sídlem této ZSPO je budova sekce informatiky MFF UK na Malostranském náměstí 25, 11800 Praha 1.
Národní úkoly při tvorbě a dodávání jazykových dat, úkoly vzdělávací a výzkumné budou plnit jednotlivé zakladatelské organizace v jejich stávající struktuře. Organizačně budou jednotlivá pracoviště podporovaná z prostředků LINDAT-Clarin oddělena v rámci těchto organizací.
Publications
Total number of publications: 91
2013
-
Towards taggers and parsers for Slovak
Human Language Technologies as a Challenge for Computer Science and Linguistics. Proceedings of the 6th Language and Technology Conference, year: 2013
-
Type-based Search of Idiomatic Expression
Seventh Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2013, year: 2013
-
Typos in Czech Corpora
Seventh Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2013, year: 2013
-
Web Application for Semantic Network Editing
Seventh Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2013, year: 2013
-
Web Spam
Proceedings of the 8th Web as Corpus Workshop (WAC-8) @Corpus Linguistics 2013, year: 2013
-
百億語のコーパスを用いた日本語の語彙・文法情報のプロファイリング
Year: 2013
2012
-
A database of semantic clusters of verb usages
Proceedings of the 8th International Conference on Language Resources and Evaluation (LREC 2012), year: 2012
-
Adaptation of Czech Parsers for Slovak
RASLAN 2012 Recent Advances in Slavonic Natural Language Processing, year: 2012
-
Behaviour of the Czech Suffix -ák – A Case Study
Proceedings of Recent Advances in Slavonic Natural Language Processing, RASLAN 2012, year: 2012
-
Building a 70 billion word corpus of English from ClueWeb
Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12), year: 2012