Locked History Actions

Różnice "About"

Różnice pomiędzy wersjami 8 i 35 (Spinanie 27 wersji)
Wersja 8 z 2014-08-19 12:15:29
Rozmiar: 13553
Komentarz:
Wersja 35 z 2014-08-19 12:48:02
Rozmiar: 11247
Komentarz:
Usunięcia zostały oznaczone w ten sposób. Dodatki zostały oznaczone w ten sposób.
Linia 8: Linia 8:
== Publications ==

 1. [[http://www.degruyter.com/view/product/428667|Ogrodniczuk (ed.) – Coreference: Annotation, Resolution and Evaluation in Polish]]
   
BibTeX
 * [[http://zil.ipipan.waw.pl/PolishCoreferenceCorpus|Polish Coreference Corpus]]
 * [[http://zil.ipipan.waw.pl/PolishCoreferenceTools|Polish Coreference Tools]]


== Publications and project presentations ==

 1. [[http://www.degruyter.com/view/product/428667|Ogrodniczuk (ed.) – Coreference: Annotation, Resolution and Evaluation in Polish]]<<BR>>
 A monograph published by Walther De Gruyter.

  *
BibTeX citation<<BR>> <<BR>>
  
Linia 13: Linia 20:
 1. [[attachment:cognitive-linguistics.pdf|Zawisławska, Ogrodniczuk – The same or just much the same? Problems with coreference from the reader’s perspective]]
(book chapter; see also BibTeX )


 * DAARC 2011: [[attachment:daarc-2011.pdf|Ogrodniczuk, Kopeć – Rule-based coreference resolution module for Polish]] (zob. też [[attachment:daarc-2011-plakat.pdf|plakat]])
 * LTC 2011: [[attachment:ltc-2011.pdf|Ogrodniczuk, Kopeć – End-to-end coreference resolution baseline system for Polish]] (zob. też [[attachment:ltc-2011-wystapienie.pdf|prezentację]])
 * KES-AMSTA 2011: [[attachment:kes-amsta-2011.pdf|Dunin-Kęplicz, Szałas – Epistemic Profiles and Belief Structures]]
 * LREC 2012: [[attachment:lrec-2012.pdf|Kopeć, Ogrodniczuk – Creating a Coreference Resolution System for Polish]] (zob. też [[attachment:lrec-2012-plakat.pdf|plakat]])
 * KI 2012: [[attachment:ki-2012.pdf|Ogrodniczuk, Zawisławska – Semantic Approach to Identity in Coreference Resolution Task]]
 * ICIC 2013: [[attachment:icic-2011.pdf|Dunin-Kęplicz, Szałas – Taming Complex Beliefs]]
 * CICLING 2013: [[attachment:cicling-2013.pdf|Ogrodniczuk, Zawisławska, Głowińska, Savary – Coreference annotation schema for an inflectional language]]
 * LP&IIS 2013: [[attachment:iis-2013.pdf|Ogrodniczuk – Translation- and projection-based unsupervised coreference resolution for Polish]] (zob. też [[attachment:iis-prezentacja.pdf|prezentację]])
 * NLDB 2013: [[attachment:nldb-2013.pdf|Ogrodniczuk, Lenart – A Multi-Purpose Online Toolset for NLP Applications]]
 * CLIMA 2013: [[attachment:4ql.pdf|Dunin-Kęplicz, Strachocka – Perceiving Rules under Incomplete and Inconsistent Information]]
 * CNCCL 2013: [[attachment:cnccl-2013.pdf|Ogrodniczuk, Głowińska, Kopeć, Savary, Zawisławska – Interesting Linguistic Features in Coreference Annotation of a Highly Inflectional Language]] (zob. też [[attachment:cnccl.pdf|plakat]])
 * MIKE 2013: [[attachment:mike.pdf|Ogrodniczuk – Discovery of Common Nominal Facts for Coreference Resolution: Proof of concept]] (zob. też [[attachment:mike-prezentacja.pdf|prezentację]])
 * LTC 2013: [[attachment:ltc-2013-2.pdf|Nitoń – Evaluation of Uryupina’s coreference resolution features for Polish]] (zob. też [[attachment:ltc-niton-prezentacja.pdf|prezentację]])
 * LTC 2013: [[attachment:ltc-2013.pdf|Ogrodniczuk, Głowińska, Kopeć, Savary, Zawisławska – Polish Coreference Corpus]] (zob. też [[attachment:ltc-pcc-prezentacja.pdf|prezentację]])
 * ACIIDS 2014: [[attachment:ACIIDS-2014.pdf|Kopeć, Ogrodniczuk – Inter-Annotator Agreement in Coreference Annotation of Polish]] (zob. też [[attachment:aciids-2014-plakat.pdf|plakat]])
 * EACL 2014: [[attachment:EACL-2014-short.pdf|Kopeć – Zero subject detection for Polish]] (zob. też [[attachment:eacl-2014-prezentacja.pdf|prezentację]] i [[attachment:EACL-2013-1.pdf|wersję długą]])
 * EACL 2014: [[attachment:eacl-demo.pdf|Kopeć – MMAX2 for coreference annotation]]
 * LREC 2014: [[attachment:lrec-2014.pdf|Ogrodniczuk, Kopeć, Savary – Polish Coreference Corpus in Numbers]]

== Plakaty ==
 * [[attachment:daarc-2011-plakat.pdf|Ogrodniczuk, Kopeć – Rule-based coreference resolution module for Polish]] (DAARC 2011)
 * [[attachment:lrec-2012-plakat.pdf|Kopeć, Ogrodniczuk – Creating a Coreference Resolution System for Polish]] (LREC 2012)
 * [[attachment:hlt-2012.pdf|Kopeć, Ogrodniczuk – LRT for Polish coreference annotation and resolution]] (HLT 2012)
 * [[attachment:cnccl.pdf|Ogrodniczuk, Głowińska, Kopeć, Savary, Zawisławska – Interesting Linguistic Features in Coreference Annotation of Polish]] (CNCCL 2013)
 * [[attachment:aciids-2014-plakat.pdf|Kopeć, Ogrodniczuk – Inter-Annotator Agreement in Coreference Annotation of Polish]] (ACIIDS 2014)
 * [[attachment:lrec-2014-plakat.pdf|Ogrodniczuk, Kopeć, Savary – Polish Coreference Corpus in Numbers]] (LREC 2014)

== Wystąpienia ==
 * konferencja LTC 2011, Poznań, 26 listopada 2011: [[attachment:ltc-2011-wystapienie.pdf|Ogrodniczuk, Kopeć – End-to-end coreference resolution baseline system for Polish]]
 * seminarium IPI, Warszawa, 5 marca 2012: [[attachment:seminarium-2012-03.pdf|Ogrodniczuk, Głowińska, Zawisławska, Kopeć, Savary – Wstępna weryfikacja typologii i strategii anotacji koreferencji w tekstach polskich]] (zob. też [[http://nlp.ipipan.waw.pl/NLP-SEMINAR/120305.html|krótki opis]])
 * konferencja 'Cognitive Linguistics in the Year 2012', Wrocław, 17-18 września 2012: [[attachment:wroclaw-2012.pdf|Zawisławska, Ogrodniczuk – Ten sam czy taki sam? O problemach z identycznością z perspektywy odbiorcy]] (zob. też [[attachment:wroclaw-2012-opis.pdf|krótki opis]])
 * konferencja LP&IIS 2013, Warszawa, 18 czerwca 2013: [[attachment:iis-prezentacja.pdf|Ogrodniczuk – Translation- and projection-based unsupervised coreference resolution for Polish]]
 * seminarium IPI, Warszawa, 3 grudnia 2012: [[attachment:seminarium-2012-12.pdf|Ogrodniczuk, Głowińska, Zawisławska, Kopeć, Savary – Polski korpus koreferencyjny: wersja wstępna]] (zob. też [[http://nlp.ipipan.waw.pl/NLP-SEMINAR/121203.html|krótki opis]])
 * konferencja LTC 2013, Poznań, 7 grudnia 2013: [[attachment:ltc-niton-prezentacja.pdf|Nitoń – Evaluation of Uryupina’s coreference resolution features for Polish]]
 * konferencja LTC 2013, Poznań, 9 grudnia 2013: [[attachment:ltc-pcc-prezentacja.pdf|Ogrodniczuk, Głowińska, Kopeć, Savary, Zawisławska – Polish Coreference Corpus]]
 * konferencja MIKE 2013, Virudhunagar, 18 grudnia 2013: [[attachment:mike-prezentacja.pdf|Ogrodniczuk – Discovery of Common Nominal Facts for Coreference Resolution: Proof of concept]]
 * seminarium IPI, Warszawa, 27 stycznia 2014: [[attachment:seminarium-2014-01.pdf|Kopeć – Automatyczne wykrywanie podmiotu zerowego]] (zob. też [[http://nlp.ipipan.waw.pl/NLP-SEMINAR/140127.html|krótki opis]])
 * konferencja EACL 2014, Göteborg, 29 kwietnia 2014: [[attachment:eacl-2014-prezentacja.pdf|Kopeć – Zero subject detection for Polish]]

== Instrukcje i raporty ==

 * [[attachment:instrukcja-merytoryczna.pdf|Instrukcja merytoryczna]]
 * [[attachment:instrukcja-techniczna-anotacji.pdf|Instrukcja techniczna anotacji]]
 * [[attachment:instrukcja-techniczna-superanotacji.pdf|Instrukcja techniczna superanotacji]]
 * [[attachment:organizacja-pracy.pdf|Organizacja pracy anotacyjnej]]
 * [[attachment:przeglad-narzedzi.pdf|Przegląd narzędzi do anotacji]]
 * [[attachment:zgodnosc-anotatorow.pdf|Zgodność anotatorów]]
 * [[attachment:metryki.pdf|Metryki ewaluacyjne]]
 * [[attachment:ewaluacja_core.pdf|Ewaluacja narzędzi zgodnie z ARE i SemEval]]
 * [[attachment:narzedzia_automatyczne_koreferencja.pdf|Przegląd automatycznych narzędzi rozwiązujących koreferencję]]

== Inne dokumenty wewnętrzne ==

 * [[https://docs.google.com/spreadsheet/ccc?key=0Ahijd9TXRMDcdEQ5bjRhZGl2MWMtOXpHNW5sMmwzUmc&usp=drive_web|Harmonogram i notatki z eksperymentów anotacyjnych]] na Google Drive
 * [[Format danych]]
 * [[attachment:opis_eksperymentow_anotacyjnych.pdf|Opis eksperymentów anotacyjnych]]
 * Opis Polskiego Korpusu Koreferencyjnego na stronie PKK:
  * [[http://zil.ipipan.waw.pl/PolishCoreferenceCorpus?action=AttachFile&do=get&target=PCC_README_EN.pdf|po angielsku]]
  * [[http://zil.ipipan.waw.pl/PolishCoreferenceCorpus?action=AttachFile&do=get&target=PCC_README_PL.pdf|po polsku]]
 * Statystyki korpusowe
  * [[attachment:statystyki-krotkie.pdf|dla tekstów krótkich]]
  * [[attachment:statystyki-dlugie.pdf|dla tekstów długich]]

== Raporty techniczne ze stażów ==

Piotra Batki ze stażu lingwistycznego:
 * [[attachment:batko-cechy.pdf|Raport z analizy cech lingwistycznych]]
 * [[attachment:batko-kwerenda.pdf|Raport z przeglądu polskiej literatury językoznawczej poświęconej koreferencji]]

Bartłomieja Nitonia ze stażu informatycznego:
 * [[attachment:niton-raport.pdf|Raport techniczny z analizy przydatności cech do rozpoznawania koreferencji opisanych przez Olgę Uryupinę dla języka polskiego]]

== Zasoby i narzędzia ==
 * [[http://zil.ipipan.waw.pl/PolishCoreferenceCorpus|Polski Korpus Koreferencyjny]]
 * [[http://glass.ipipan.waw.pl:11111/index.xhtml|Polski Korpus Koreferencyjny zwizualizowany za pomocą narzędzia brat]]
 * [[http://zil.ipipan.waw.pl/PolishCoreferenceTools|Narzędzia koreferencyjne]]

  * BibTeX citation
  * Springer LNCS link

 1. [[attachment:cognitive-linguistics.pdf|Zawisławska, Ogrodniczuk – The same or just much the same? Problems with coreference from the reader’s perspective]] (book chapter)

  * BibTeX citation
  * book page
  *
  * konferencja 'Cognitive Linguistics in the Year 2012', Wrocław, 17-18 września 2012: [[attachment:wroclaw-2012.pdf|Zawisławska, Ogrodniczuk – Ten sam czy taki sam? O problemach z identycznością z perspektywy odbiorcy]] (zob. też [[attachment:wroclaw-2012-opis.pdf|krótki opis]])


 1. [[attachment:lrec-2014.pdf|Ogrodniczuk, Kopeć, Savary – Polish Coreference Corpus in Numbers]] (LREC 2014 conference paper)

  * BibTeX citation
  * Springer LNCS link
  * [[attachment:lrec-2014-plakat.pdf|LREC 2014 poster]]


 1. EACL 2014: [[attachment:eacl-demo.pdf|Kopeć – MMAX2 for coreference annotation]]

  * BibTeX citation
  * Springer LNCS link


 1. EACL 2014: [[attachment:EACL-2014-short.pdf|Kopeć – Zero subject detection for Polish]] (zob. też [[attachment:eacl-2014-prezentacja.pdf|prezentację]] i [[attachment:EACL-2013-1.pdf|wersję długą]])

konferencja EACL 2014, Göteborg, 29 kwietnia 2014:

  * BibTeX citation
  * Springer LNCS link
  * [[attachment:eacl-2014-prezentacja.pdf|EACL 2014 presentation]]


 1. ACIIDS 2014: [[attachment:ACIIDS-2014.pdf|Kopeć, Ogrodniczuk – Inter-Annotator Agreement in Coreference Annotation of Polish]] (zob. też [[attachment:aciids-2014-plakat.pdf|plakat]])

  * BibTeX citation
  * Springer LNCS link
  * [[attachment:aciids-2014-plakat.pdf|ACIIDS 2014 poster]]

 1. seminarium IPI, Warszawa, 27 stycznia 2014: [[attachment:seminarium-2014-01.pdf|Kopeć – Automatyczne wykrywanie podmiotu zerowego]]

  * [[http://nlp.ipipan.waw.pl/NLP-SEMINAR/140127.html|short description]]


 1. LTC 2013: [[attachment:ltc-2013.pdf|Ogrodniczuk, Głowińska, Kopeć, Savary, Zawisławska – Polish Coreference Corpus]] (zob. też [[attachment:ltc-pcc-prezentacja.pdf|prezentację]])

konferencja LTC 2013, Poznań, 9 grudnia 2013:

  * BibTeX citation
  * Springer LNCS link
  * [[attachment:ltc-pcc-prezentacja.pdf|LTC 2013 presentation]]


 1. LTC 2013: [[attachment:ltc-2013-2.pdf|Nitoń – Evaluation of Uryupina’s coreference resolution features for Polish]] (zob. też [[attachment:ltc-niton-prezentacja.pdf|prezentację]])

konferencja LTC 2013, Poznań, 7 grudnia 2013:

  * BibTeX citation
  * Springer LNCS link
  * [[attachment:ltc-niton-prezentacja.pdf|LTC 2013 presentation]]


 1. MIKE 2013: [[attachment:mike.pdf|Ogrodniczuk – Discovery of Common Nominal Facts for Coreference Resolution: Proof of concept]] (zob. też [[attachment:mike-prezentacja.pdf|prezentację]])

konferencja MIKE 2013, Virudhunagar, 18 grudnia 2013:

  * BibTeX citation
  * Springer LNCS link
  * [[attachment:mike-prezentacja.pdf|MIKE 2013 presentation]]


 1. CNCCL 2013: [[attachment:cnccl-2013.pdf|Ogrodniczuk, Głowińska, Kopeć, Savary, Zawisławska – Interesting Linguistic Features in Coreference Annotation of a Highly Inflectional Language]] (zob. też [[attachment:cnccl.pdf|plakat]])

  * BibTeX citation
  * Springer LNCS link
  * [[attachment:cnccl.pdf|CNCCL 2013 poster]]


 1. NLDB 2013: [[attachment:nldb-2013.pdf|Ogrodniczuk, Lenart – A Multi-Purpose Online Toolset for NLP Applications]]

  * BibTeX citation
  * Springer LNCS link


 1. LP&IIS 2013: [[attachment:iis-2013.pdf|Ogrodniczuk – Translation- and projection-based unsupervised coreference resolution for Polish]] (zob. też [[attachment:iis-prezentacja.pdf|prezentację]])

konferencja LP&IIS 2013, Warszawa, 18 czerwca 2013:

  * BibTeX citation
  * Springer LNCS link
  * [[attachment:iis-prezentacja.pdf|LP&IIS 2013 presentation]]


 1. CICLING 2013: [[attachment:cicling-2013.pdf|Ogrodniczuk, Zawisławska, Głowińska, Savary – Coreference annotation schema for an inflectional language]]

  * BibTeX citation
  * Springer LNCS link


 1. seminarium IPI, Warszawa, 3 grudnia 2012: [[attachment:seminarium-2012-12.pdf|Ogrodniczuk, Głowińska, Zawisławska, Kopeć, Savary – Polski korpus koreferencyjny: wersja wstępna]]
  * [[http://nlp.ipipan.waw.pl/NLP-SEMINAR/121203.html|short description]]

 1. KI 2012: [[attachment:ki-2012.pdf|Ogrodniczuk, Zawisławska – Semantic Approach to Identity in Coreference Resolution Task]]

  * BibTeX citation
  * Springer LNCS link

 1. HLT 2012: [[attachment:hlt-2012.pdf|Kopeć, Ogrodniczuk – LRT for Polish coreference annotation and resolution]]

    Poster presented at


 1. LREC 2012: [[attachment:lrec-2012.pdf|Kopeć, Ogrodniczuk – Creating a Coreference Resolution System for Polish]] (zob. też [[attachment:lrec-2012-plakat.pdf|plakat]])

  * BibTeX citation
  * Springer LNCS link
  * [[attachment:lrec-2012-plakat.pdf|LREC 2012 poster]]

 1. seminarium IPI, Warszawa, 5 marca 2012: [[attachment:seminarium-2012-03.pdf|Ogrodniczuk, Głowińska, Zawisławska, Kopeć, Savary – Wstępna weryfikacja typologii i strategii anotacji koreferencji w tekstach polskich]]

 * [[http://nlp.ipipan.waw.pl/NLP-SEMINAR/120305.html|short description]]


 1. LTC 2011: [[attachment:ltc-2011.pdf|Ogrodniczuk, Kopeć – End-to-end coreference resolution baseline system for Polish]] (zob. też [[attachment:ltc-2011-wystapienie.pdf|prezentację]])

konferencja LTC 2011, Poznań, 26 listopada 2011:

  * BibTeX citation
  * Springer LNCS link
  * [[attachment:ltc-2011-wystapienie.pdf|LTC 2011 presentation]]


 1. DAARC 2011: [[attachment:daarc-2011.pdf|Ogrodniczuk, Kopeć – Rule-based coreference resolution module for Polish]] (DAARC 2011 conference paper)

  * BibTeX citation
  * Springer LNCS link
  * [[attachment:daarc-2011-plakat.pdf|DAARC 2011 poster]]

The CORE project

The work reported here was carried out within the Computer-based methods for coreference resolution in Polish texts (PL: Komputerowe metody identyfikacji nawiązań w tekstach polskich) project financed by the Polish National Science Centre (contract number 6505/B/T02/2011/40) and carried out between April 2011 and July 2014 at the Institute of Computer Science, Polish Academy of Sciences. It was targeted at the creation of innovative methods and tools for automated coreference resolution in Polish, with planned quality compared to state-of-the-art tools available for other languages.

Project results

Publications and project presentations

  1. Ogrodniczuk (ed.) – Coreference: Annotation, Resolution and Evaluation in Polish
    A monograph published by Walther De Gruyter.

    • BibTeX citation

  2. Ogrodniczuk, Wójcicka, Głowińska, Kopeć – Nested Mention Detection for Polish Coreference Resolution (PolTAL 2014 conference paper)

    • BibTeX citation
    • Springer LNCS link
  3. Zawisławska, Ogrodniczuk – The same or just much the same? Problems with coreference from the reader’s perspective (book chapter)

  4. Ogrodniczuk, Kopeć, Savary – Polish Coreference Corpus in Numbers (LREC 2014 conference paper)

  5. EACL 2014: Kopeć – MMAX2 for coreference annotation

    • BibTeX citation
    • Springer LNCS link
  6. EACL 2014: Kopeć – Zero subject detection for Polish (zob. też prezentację i wersję długą)

konferencja EACL 2014, Göteborg, 29 kwietnia 2014:

  1. ACIIDS 2014: Kopeć, Ogrodniczuk – Inter-Annotator Agreement in Coreference Annotation of Polish (zob. też plakat)

  2. seminarium IPI, Warszawa, 27 stycznia 2014: Kopeć – Automatyczne wykrywanie podmiotu zerowego

  3. LTC 2013: Ogrodniczuk, Głowińska, Kopeć, Savary, Zawisławska – Polish Coreference Corpus (zob. też prezentację)

konferencja LTC 2013, Poznań, 9 grudnia 2013:

  1. LTC 2013: Nitoń – Evaluation of Uryupina’s coreference resolution features for Polish (zob. też prezentację)

konferencja LTC 2013, Poznań, 7 grudnia 2013:

  1. MIKE 2013: Ogrodniczuk – Discovery of Common Nominal Facts for Coreference Resolution: Proof of concept (zob. też prezentację)

konferencja MIKE 2013, Virudhunagar, 18 grudnia 2013:

  1. CNCCL 2013: Ogrodniczuk, Głowińska, Kopeć, Savary, Zawisławska – Interesting Linguistic Features in Coreference Annotation of a Highly Inflectional Language (zob. też plakat)

  2. NLDB 2013: Ogrodniczuk, Lenart – A Multi-Purpose Online Toolset for NLP Applications

    • BibTeX citation
    • Springer LNCS link
  3. LP&IIS 2013: Ogrodniczuk – Translation- and projection-based unsupervised coreference resolution for Polish (zob. też prezentację)

konferencja LP&IIS 2013, Warszawa, 18 czerwca 2013:

  1. CICLING 2013: Ogrodniczuk, Zawisławska, Głowińska, Savary – Coreference annotation schema for an inflectional language

    • BibTeX citation
    • Springer LNCS link
  2. seminarium IPI, Warszawa, 3 grudnia 2012: Ogrodniczuk, Głowińska, Zawisławska, Kopeć, Savary – Polski korpus koreferencyjny: wersja wstępna

  3. KI 2012: Ogrodniczuk, Zawisławska – Semantic Approach to Identity in Coreference Resolution Task

    • BibTeX citation
    • Springer LNCS link
  4. HLT 2012: Kopeć, Ogrodniczuk – LRT for Polish coreference annotation and resolution

    • Poster presented at
  5. LREC 2012: Kopeć, Ogrodniczuk – Creating a Coreference Resolution System for Polish (zob. też plakat)

  6. seminarium IPI, Warszawa, 5 marca 2012: Ogrodniczuk, Głowińska, Zawisławska, Kopeć, Savary – Wstępna weryfikacja typologii i strategii anotacji koreferencji w tekstach polskich

  7. short description

  8. LTC 2011: Ogrodniczuk, Kopeć – End-to-end coreference resolution baseline system for Polish (zob. też prezentację)

konferencja LTC 2011, Poznań, 26 listopada 2011:

  1. DAARC 2011: Ogrodniczuk, Kopeć – Rule-based coreference resolution module for Polish (DAARC 2011 conference paper)

External contributions

Parts of the work described here were also contributed by other externally funded projects, carried out simultaneously with CORE:

  • works on the new version of the Polish grammar for Spejd by Alicja Wójcicka and Katarzyna Głowińska were co-funded by the Polish Ministry of Science and Higher Education as an Investment in CLARINPL Research Infrastructure and by the European Union from resources of the European Social Fund
  • works related to linguistic evaluation of usefulness of Uryupina’s coreference features for Polish by Piotr Batko and development of adaptation of BART (Beautiful Anaphora Resolution Toolkit) for Polish by Bartłomiej Nitoń were co-funded by the European Union from financial resources of the European Social Fund, project PO KL Information technologies: Research and their interdisciplinary applications

  • works related to coreference-based approach to summarization were carried out within PhD studies of Mateusz Kopeć at the Institute of Computer Science, Polish Academy of Sciences

  • help with adaptation of coreference tools to Multiservice, a Web service framework for Polish NLP tools, was offered by Michał Lenart taking part in CESAR project (Central and South-east European Resources, part of META-NET) financed from a European Competitiveness and Innovation framework Programme, Information and Communication Technologies Policy Support Programme (CIP ICT-PSP, grant agreement 271022)

  • projection-based experiments were made possible by the University Research Program for Google Translate

  • contacts established with the parallel French coreference annotation project ANCOR were also beneficial for some of our scientific results and helped relate the CORE project more deeply to the international coreference community.

Project team

The core CORE project team constituted of (almost alphabetically):

  • Maciej Ogrodniczuk — principal investigator
  • Barbara Dunin-Kęplicz — formalization of coreference rules
  • Maria Głąbska — coreference annotation
  • Katarzyna Głowińska — linguistic expertise related to anaphora, coreference and Polish syntax
  • Anna Grzeszak — coreference annotation
  • Mateusz Kopeć — technical leadership, implementation and IT design, development of the annotation environment and project tools
  • Emilia Kubicka — coreference annotation
  • Barbara Masny — coreference annotation
  • Paulina Rosalska — coreference annotation
  • Agata Savary — coreference annotation and annotation work expertise
  • Magdalena Zawisławska — linguistic and semantic expertise, annotation management, adjudication of the annotation of Polish Coreference Corpus
  • Sebastian Żurowski — coreference annotation

but there were numerous other people, mainly colleagues from the Linguistic Engineering Group at the Institute of Computer Science, Polish Academy of Sciences, who contributed to various stages of the project with their selfless help:

  • Piotr Batko — coreference annotation, verification of coreference features for Polish (linguistic part)
  • Łukasz Degórski — help related to processing NKJP data
  • Łukasz Debowski — statistical expertise
  • Michał Lenart — help related to processing NKJP data, hardware expertise, Multiservice integration assistance
  • Małgorzata Marciniak — HPSG anaphora expertise
  • Bartłomiej Nitoń — verification of coreference features for Polish (implementation part)
  • Adam Przepiórkowski — linguistic and natural language processing expertise, management of co-operation with the National Corpus of Polish
  • Filip Skwarski — translation and proofreading
  • Jakub Waszczuk — expertise related to annotation and named entity-related tools, versioning system management
  • Joanna Wierucka — translation and proofreading.