prototype ontology for syntactic annotation.
Important note: Here, an ontology of labels used in syntactic annotation is provided, but not an ontology of _structures_. Especially, the ontology itself does not perform a conversion between dependency trees and constituency analyses, though its representations may be used by corresponding converters.
Christian Chiarcos, 17/07/2007
Tiger Annotation Scheme, syntactic component
based upon Bader, R. et al. (2003), "TIGER Annotationsschema", Draft 24.07.2003
Note, that the syntactic sub-ontology is not concerned with the alignment with part of speech tags and morphology but only with the relationships between syntactic nodes.
TODO: ObjectProperties of semantic and syntactic features
updated 10/02/18, Christian Chiarcos chiarcos@uni-potsdam.de
function labels of VPs and clauses (S)
Jedes Verb f¨uhrt eine eigenst¨andige Phrase ein.
Phrasen mit finitem Verb bekommen das Label S
(Satz)
(Bader et al. 2003, §5.1)
edge labels within a noun phrase (Bader et al. 2003, §2)
Syntactic nodes are terminal or nonterminal nodes in a syntactic tree, either a dependency tree or a phrase structure.
1
cat
Als erste Richtlinie gilt zun¨achst: In NPs, APs und PPs werden die zu koordinierenden Elemente
direkt zusammengefaßt und bilden wieder eine Konstituente. In VPs und S¨atzen verbinden sich die
VP- und S-Knoten zuerst mit den Dependenten auf ihrer Seite der Koordination und werden dann zu
einer koordinierten Phrase zusammengefaßt (siehe Beispiele).
Beachte: die Pr¨asenz einer koordinierenden Konjunktion ist nicht notwendig. Aufz¨ahlungen werden
ebenso annotiert.
(Bader et al. 2003, §9)
Relations between syntactic nodes.
Note that here, edge labels are coded as properties of child nodes. The corresponding parent node in the syntactic tree (dependency or phrase structure) has to be inferred from the dominates property
label
1
(Bader et al. 2003, §4)
edge labels within a PP, especially including all NP edges. (Bader et al. 2003, §3)
function labels within an adjective phrase
Im Falle von deverbalen Adjektiven werden die Argumente des Verbs vererbt und mit ihren
urspr¨unglichen Funktionen annotiert.
(Bader et al. 2003, §4.7)
structural relationship between
(a) a phrase and the syntactic nodes it is attached to (in constituency analysis), or
(b) a head and its children (in dependency analysis)
The head/phrase dominates its children.
Different types of dominates relations may be distinguished via edge labels which are attached to the child nodes.
different relationships (edges, function labels) between parent (head/phrase) and child nodes may be distinguished via different edge labels attached to the child node.
applies to coordinated adverbial phrases and coordinated complementisers, examples in Bader et al. (2003), § 5.2.1
CJ
passivised subject (PP)
AG
NM
complex (multi-token) numeral within an noun phrase.
"Für komplexe Numeralien (10 000, eine Million) ist das Label NM (NuMber) vorgesehen. Die einzelnen Komponenten bekommen das Funktionslabel
NMC (NuMber Component)."
(Bader etal. 2003, §2.1.2)
CO
CD
OP
DH
PD
MO
Modifier, German "Modifikator" (Bader et al. 2003, §2)
Applies within NPs only to focus particles, e.g. nur, auch, lediglich,
zumindest, vor allem, . . . which are annotated regardless of their positioning within the NP (Bader et al. 2003, §2.7).
Within adjective phrases, label of PPs and adverbials (Bader et al. 2003, §4.1)
also applies to VPs (Bader et al. 2003, §5)
PN
Vorname(n), Familienname(n) und Namenszus¨atze werden alle unter dem Knoten PN (proper noun)
zusammengefaßt und als eine komplexe Kernkomponente der NP betrachtet. Die einzelnen Komponenten
des PN werden als PNC (proper noun component) annotiert.
Dasselbe gilt für fremdsprachliche Namen. Komponenten von Firmennamen wie Bayerische Vereinsbank
sowie Titel werden dagegen als NKs annotiert.
(Bader et al. 2003, §2.1.4)
NP
noun phrase (Bader et al. 2003, §2)
Eine NP besteht zun"achst aus einer Reihe von pronominalen, substantivischen und adjektivischen Kernelementen (NP kernel elements, NK). Ihre genauere Unterteilung kann aufgrund der Part-of-Speech bzw. kategorialen Information vorgenommen werden, so dass sich eine Unterscheidung auf der Ebene der Funktionslabels er"ubrigt.
AC
VO
JU
DA
OC
HD
AC
RS
AVC
flat analysis of foreign material
"Fremdsprachliche Zitate werden als Chunks (CH) flach annotiert; die einzelnen Komponenten erhalten das Label UC (“unit component”)."
(Bader et al. 2003, §2.1.5)
CH
CM
DL
applied to direct speech
Da f¨ur uns die syntaktische Struktur Vorrang hat vor der Diskursstruktur, wird die letztere nur annotiert,
wenn keine klaren syntaktischen Beziehungen bestehen. So wird im folgenden Satz die angefu
¨ hrte A¨ ußerung als OC zu sagt annotiert.
(65) “Nun”, sagt Peter, “m¨ussen wir nach Hause gehen”.
Wenn hingegen keine syntaktische Beziehung (meistens OC) zwischen dem Angef¨uhrten und der es
einbettenden Diskursstruktur besteht, verbinden sich die beiden Komponenten parataktisch zu einer
Discourse Level Constituent (DL). Die Bestandteile einer DL sind: RS (reported speech) und DH
(discourse-level head).
(Bader et al. 2003, §5.5)
CAC
OA
accusative argument of a verb phrase (Bader et al. 2003, §5) or a deverbal adjective
(Bader et al. 2003, §4)
Part of a multi-token (complex) numeral.
Für komplexe Numeralien (10 000, eine Million) ist das Label NM (NuMber) vorgesehen. Die einzelnen Komponenten bekommen das Funktionslabel NMC (NuMber Component).
(Bader etal. 2003, §2.12)
NMC
DM
SP
a pro-form that is resolved by a repeated element
(Bader et al. 2003, §6.1)
also, the so-called vorfeld-es: Vorfeld-es (PH ohne RE)
Test: steht nur im Vorfeld (d.h., dieses es h¨angt
weder vom Auftreten eines satzwertigen Arguments
ab noch vom Verb) (Bader et al. 2003, §6.2)
PH
MW
"way"
CVZ
AMS
PG
S
QL
quasi-language
Fremdsprachliche Zitate werden als Chunks (CH) flach annotiert; die einzelnen Komponenten erhalten
das Label UC (“unit component”).
(Bader et al. 2003, § 2.1.5)
UC
AP
(Bader et al. 2003, §4)
SB
(Bader et al. 2003, §5)
EP
expletive es
AA
CVP
Als erste Richtlinie gilt zun¨achst: In NPs, APs und PPs werden die zu koordinierenden Elemente
direkt zusammengefaßt und bilden wieder eine Konstituente. In VPs und S¨atzen verbinden sich die
VP- und S-Knoten zuerst mit den Dependenten auf ihrer Seite der Koordination und werden dann zu
einer koordinierten Phrase zusammengefaßt (siehe Beispiele).
(Bader et al. 2003, §9.1)
MC
"Funktionsverbgefüge"
CVC
NK
OG
Relativs¨atze werden als T¨ochter des NP-Knotens annotiert, und zwar unabh¨angig davon, ob sie extraponiert
sind oder nicht. Sie werden mit dem Label RC (relative clause) gekennzeichnet. (Bader et al. 2003, §2.6)
Also applies to cleft sentences: Cleft-S¨atze: Der Relativsatz soll immer als RC zur pr¨adikativen NP annotiert werden. Das Pronomen
es ist Subjekt.
RC
(Bader et al. 2003, §9.1)
CNP
PAR
CS
ML
CP
(Bader et al. 2003, §5)
RE
MNR
verbal phrase with a non-finite verb.
Jedes Verb f¨uhrt eine eigenst¨andige Phrase ein.
Phrasen mit finitem Verb bekommen das Label S
(Satz)
(Bader et al. 2003, §5.1)
VP
comparative complement, German "Vergleichskomplement"
applies to NPs (Bader et al. 2003, §2), PPs (Bader et al. §3), and APs (Bader et al. §4)
Adjektive im Komparativ k¨onnen sich mit einem
zus¨atzlichen Argument verbinden, einer mit
als eingeleiteten Phrase, wobei die Kategorie der
Phrase vom als unabh¨angig ist. Dieses Argument
bekommt das Funktionslabel CC (comparative
complement), das Wort als das Label CM (comparative
conjunction). Siehe auch die Abschnitte
7.2 und 6.4.
(Bader et al. 2003, §4.5)
CC
MI
CAVP
PM
CPP
ISU
AVP
MTA
coordinated conjunctions
(Bader et al. 2003, §5.2.1, §9.2)
CCP
CAP
(Bader et al. 2003, §9.1)
SVP
(Bader et al. 2003, §5)
PNC
Vorname(n), Familienname(n) und Namenszus¨atze werden alle unter dem Knoten PN (proper noun)
zusammengefaßt und als eine komplexe Kernkomponente der NP betrachtet. Die einzelnen Komponenten
des PN werden als PNC (proper noun component) annotiert.
Dasselbe gilt f¨ur fremdsprachliche Namen. Komponenten von Firmennamen wie Bayerische Vereinsbank
sowie Titel werden dagegen als NKs annotiert.
(Bader et al. 2003, §2.1.4)
APP
NG
PP
PPs werden wie NPs behandelt, also auch flach
annotiert. Die Pr¨a-/Post-/Zirkumposition (PoSTags:
APPR / APPO / APZR) bekommt das Label
AC (adpositional case marker). Sonst ¨andert
sich die Struktur nicht.
(Bader et al. 2003, §3.1)
OA2
object accusative 2 (Bader et al. 2003, §5)
MR