prototype ontology for syntactic annotation. Important note: Here, an ontology of labels used in syntactic annotation is provided, but not an ontology of _structures_. Especially, the ontology itself does not perform a conversion between dependency trees and constituency analyses, though its representations may be used by corresponding converters. Christian Chiarcos, 17/07/2007 Tiger Annotation Scheme, syntactic component based upon Bader, R. et al. (2003), "TIGER Annotationsschema", Draft 24.07.2003 Note, that the syntactic sub-ontology is not concerned with the alignment with part of speech tags and morphology but only with the relationships between syntactic nodes. TODO: ObjectProperties of semantic and syntactic features updated 10/02/18, Christian Chiarcos chiarcos@uni-potsdam.de function labels of VPs and clauses (S) Jedes Verb f¨uhrt eine eigenst¨andige Phrase ein. Phrasen mit finitem Verb bekommen das Label S (Satz) (Bader et al. 2003, §5.1) edge labels within a noun phrase (Bader et al. 2003, §2) Syntactic nodes are terminal or nonterminal nodes in a syntactic tree, either a dependency tree or a phrase structure. 1 cat Als erste Richtlinie gilt zun¨achst: In NPs, APs und PPs werden die zu koordinierenden Elemente direkt zusammengefaßt und bilden wieder eine Konstituente. In VPs und S¨atzen verbinden sich die VP- und S-Knoten zuerst mit den Dependenten auf ihrer Seite der Koordination und werden dann zu einer koordinierten Phrase zusammengefaßt (siehe Beispiele). Beachte: die Pr¨asenz einer koordinierenden Konjunktion ist nicht notwendig. Aufz¨ahlungen werden ebenso annotiert. (Bader et al. 2003, §9) Relations between syntactic nodes. Note that here, edge labels are coded as properties of child nodes. The corresponding parent node in the syntactic tree (dependency or phrase structure) has to be inferred from the dominates property label 1 (Bader et al. 2003, §4) edge labels within a PP, especially including all NP edges. (Bader et al. 2003, §3) function labels within an adjective phrase Im Falle von deverbalen Adjektiven werden die Argumente des Verbs vererbt und mit ihren urspr¨unglichen Funktionen annotiert. (Bader et al. 2003, §4.7) structural relationship between (a) a phrase and the syntactic nodes it is attached to (in constituency analysis), or (b) a head and its children (in dependency analysis) The head/phrase dominates its children. Different types of dominates relations may be distinguished via edge labels which are attached to the child nodes. different relationships (edges, function labels) between parent (head/phrase) and child nodes may be distinguished via different edge labels attached to the child node. applies to coordinated adverbial phrases and coordinated complementisers, examples in Bader et al. (2003), § 5.2.1 CJ passivised subject (PP) AG NM complex (multi-token) numeral within an noun phrase. "Für komplexe Numeralien (10 000, eine Million) ist das Label NM (NuMber) vorgesehen. Die einzelnen Komponenten bekommen das Funktionslabel NMC (NuMber Component)." (Bader etal. 2003, §2.1.2) CO CD OP DH PD MO Modifier, German "Modifikator" (Bader et al. 2003, §2) Applies within NPs only to focus particles, e.g. nur, auch, lediglich, zumindest, vor allem, . . . which are annotated regardless of their positioning within the NP (Bader et al. 2003, §2.7). Within adjective phrases, label of PPs and adverbials (Bader et al. 2003, §4.1) also applies to VPs (Bader et al. 2003, §5) PN Vorname(n), Familienname(n) und Namenszus¨atze werden alle unter dem Knoten PN (proper noun) zusammengefaßt und als eine komplexe Kernkomponente der NP betrachtet. Die einzelnen Komponenten des PN werden als PNC (proper noun component) annotiert. Dasselbe gilt für fremdsprachliche Namen. Komponenten von Firmennamen wie Bayerische Vereinsbank sowie Titel werden dagegen als NKs annotiert. (Bader et al. 2003, §2.1.4) NP noun phrase (Bader et al. 2003, §2) Eine NP besteht zun"achst aus einer Reihe von pronominalen, substantivischen und adjektivischen Kernelementen (NP kernel elements, NK). Ihre genauere Unterteilung kann aufgrund der Part-of-Speech bzw. kategorialen Information vorgenommen werden, so dass sich eine Unterscheidung auf der Ebene der Funktionslabels er"ubrigt. AC VO JU DA OC HD AC RS AVC flat analysis of foreign material "Fremdsprachliche Zitate werden als Chunks (CH) flach annotiert; die einzelnen Komponenten erhalten das Label UC (“unit component”)." (Bader et al. 2003, §2.1.5) CH CM DL applied to direct speech Da f¨ur uns die syntaktische Struktur Vorrang hat vor der Diskursstruktur, wird die letztere nur annotiert, wenn keine klaren syntaktischen Beziehungen bestehen. So wird im folgenden Satz die angefu ¨ hrte A¨ ußerung als OC zu sagt annotiert. (65) “Nun”, sagt Peter, “m¨ussen wir nach Hause gehen”. Wenn hingegen keine syntaktische Beziehung (meistens OC) zwischen dem Angef¨uhrten und der es einbettenden Diskursstruktur besteht, verbinden sich die beiden Komponenten parataktisch zu einer Discourse Level Constituent (DL). Die Bestandteile einer DL sind: RS (reported speech) und DH (discourse-level head). (Bader et al. 2003, §5.5) CAC OA accusative argument of a verb phrase (Bader et al. 2003, §5) or a deverbal adjective (Bader et al. 2003, §4) Part of a multi-token (complex) numeral. Für komplexe Numeralien (10 000, eine Million) ist das Label NM (NuMber) vorgesehen. Die einzelnen Komponenten bekommen das Funktionslabel NMC (NuMber Component). (Bader etal. 2003, §2.12) NMC DM SP a pro-form that is resolved by a repeated element (Bader et al. 2003, §6.1) also, the so-called vorfeld-es: Vorfeld-es (PH ohne RE) Test: steht nur im Vorfeld (d.h., dieses es h¨angt weder vom Auftreten eines satzwertigen Arguments ab noch vom Verb) (Bader et al. 2003, §6.2) PH MW "way" CVZ AMS PG S QL quasi-language Fremdsprachliche Zitate werden als Chunks (CH) flach annotiert; die einzelnen Komponenten erhalten das Label UC (“unit component”). (Bader et al. 2003, § 2.1.5) UC AP (Bader et al. 2003, §4) SB (Bader et al. 2003, §5) EP expletive es AA CVP Als erste Richtlinie gilt zun¨achst: In NPs, APs und PPs werden die zu koordinierenden Elemente direkt zusammengefaßt und bilden wieder eine Konstituente. In VPs und S¨atzen verbinden sich die VP- und S-Knoten zuerst mit den Dependenten auf ihrer Seite der Koordination und werden dann zu einer koordinierten Phrase zusammengefaßt (siehe Beispiele). (Bader et al. 2003, §9.1) MC "Funktionsverbgefüge" CVC NK OG Relativs¨atze werden als T¨ochter des NP-Knotens annotiert, und zwar unabh¨angig davon, ob sie extraponiert sind oder nicht. Sie werden mit dem Label RC (relative clause) gekennzeichnet. (Bader et al. 2003, §2.6) Also applies to cleft sentences: Cleft-S¨atze: Der Relativsatz soll immer als RC zur pr¨adikativen NP annotiert werden. Das Pronomen es ist Subjekt. RC (Bader et al. 2003, §9.1) CNP PAR CS ML CP (Bader et al. 2003, §5) RE MNR verbal phrase with a non-finite verb. Jedes Verb f¨uhrt eine eigenst¨andige Phrase ein. Phrasen mit finitem Verb bekommen das Label S (Satz) (Bader et al. 2003, §5.1) VP comparative complement, German "Vergleichskomplement" applies to NPs (Bader et al. 2003, §2), PPs (Bader et al. §3), and APs (Bader et al. §4) Adjektive im Komparativ k¨onnen sich mit einem zus¨atzlichen Argument verbinden, einer mit als eingeleiteten Phrase, wobei die Kategorie der Phrase vom als unabh¨angig ist. Dieses Argument bekommt das Funktionslabel CC (comparative complement), das Wort als das Label CM (comparative conjunction). Siehe auch die Abschnitte 7.2 und 6.4. (Bader et al. 2003, §4.5) CC MI CAVP PM CPP ISU AVP MTA coordinated conjunctions (Bader et al. 2003, §5.2.1, §9.2) CCP CAP (Bader et al. 2003, §9.1) SVP (Bader et al. 2003, §5) PNC Vorname(n), Familienname(n) und Namenszus¨atze werden alle unter dem Knoten PN (proper noun) zusammengefaßt und als eine komplexe Kernkomponente der NP betrachtet. Die einzelnen Komponenten des PN werden als PNC (proper noun component) annotiert. Dasselbe gilt f¨ur fremdsprachliche Namen. Komponenten von Firmennamen wie Bayerische Vereinsbank sowie Titel werden dagegen als NKs annotiert. (Bader et al. 2003, §2.1.4) APP NG PP PPs werden wie NPs behandelt, also auch flach annotiert. Die Pr¨a-/Post-/Zirkumposition (PoSTags: APPR / APPO / APZR) bekommt das Label AC (adpositional case marker). Sonst ¨andert sich die Struktur nicht. (Bader et al. 2003, §3.1) OA2 object accusative 2 (Bader et al. 2003, §5) MR