À propos de ce cours
4,424 consultations récentes

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.

Niveau débutant

Approx. 22 heures pour terminer

Recommandé : 2 - 3 h/Woche, insg. 6 Wochen...

Allemand

Sous-titres : Allemand, Anglais

Compétences que vous acquerrez

Natural Language ProcessingParsingDigital PreservationCorporaNamed-Entity Recognition

100 % en ligne

Commencez dès maintenant et apprenez aux horaires qui vous conviennent.

Dates limites flexibles

Réinitialisez les dates limites selon votre disponibilité.

Niveau débutant

Approx. 22 heures pour terminer

Recommandé : 2 - 3 h/Woche, insg. 6 Wochen...

Allemand

Sous-titres : Allemand, Anglais

Programme du cours : ce que vous apprendrez dans ce cours

Semaine
1
3 heures pour terminer

Woche 1 - Wege in die digitale Welt

In der ersten Woche werden wir darüber sprechen, wie Texte digitalisiert und zum Beispiel in XML dargestellt werden können und was OCR (optical character recognition) für die Anwendung in der Praxis bedeutet. Wir befassen uns außerdem mit der Erstellung von Korpora und den Schwierigkeiten, denen wir dabei begegnen können. Viel Spaß!

...
3 vidéos (Total 49 min), 4 lectures, 2 quiz
3 vidéos
1.2 - Herausforderungen bei der Korpusakquisition16 min
1.3 - Digitalisierungszentrum ZB12 min
4 lectures
Die Dozenten dieses MOOC's10 min
Guidelines zur Bearbeitung des MOOCs10 min
Lernziele Modul 15 min
Material Modul 110 min
2 exercices pour s'entraîner
Was wissen Sie bereits zum Thema Digitalisierung?8 min
Testen Sie Ihr Wissen zum Thema Korpusakquisition8 min
Semaine
2
2 heures pour terminer

Woche 2 - Strukturierte und nachhaltige Repräsentation von Korpusdaten

In der zweiten Woche beschäftigen wir uns mit der strukturierten und nachhaltigen Repräsentation von Korpusdaten. Wir werden über die Markup Language XML sprechen und einige wichtige Standards zur Textrepräsentation kennenlernen. In der zweiten Hälfte dieses Moduls geht es anschließend um das Thema der automatischen Text- und Wortsegmentierung. Viel Spaß mit den Videos!

...
2 vidéos (Total 45 min), 3 lectures, 2 quiz
2 vidéos
2.2 - Textsegmentierung21 min
3 lectures
Lernziele Modul 25 min
Einführungstext XML: Strukturierte und nachhaltige Repräsentation von Korpusdaten15 min
Material Modul 210 min
2 exercices pour s'entraîner
XML und TEI P5: Wie viel wissen Sie bereits?12 min
Testen Sie Ihr Wissen zum Thema Textsegmentierung6 min
Semaine
3
4 heures pour terminer

Woche 3 - Eigenschaften von Korpora und grundlegende Analysemethoden

In der dritten Woche geht es um die wichtigsten Eigenschaften von Korpora, um grundlegende Analysemethoden in der Korpuslinguistik und Grundbegriffe wie Worthäufigkeiten, Kollokationen, N-Gramme. Im letzten Teil wird Ihnen Noah Bubenhofer noch einen Ausblick auf die visuelle und graphische Darstellung von Texteigenschaften geben. Viel Spaß!

...
3 vidéos (Total 92 min), 3 lectures, 3 quiz
3 vidéos
3.2 - Hands-on Korpusanalysen27 min
3.3 - Visualisierung und graphische Darstellung32 min
3 lectures
Lernziele Modul 35 min
Visuelle Bergtour durch ein Kollokationsnetz10 min
Material Modul 310 min
2 exercices pour s'entraîner
Theorie: Grundbegriffe der Korpuslinguistik6 min
Praxis: Korpusabfragen und Analysemethoden6 min
Semaine
4
2 heures pour terminer

Woche 4 - Automatische Korpusannotation mit computerlinguistischen Werkzeugen

In diesem Modul geht es um die automatische Korpus-Annotation mit linguistischen Informationen wie Part-Of-Speech-Tags (Wortarten) und Lemmas (Grundformen), aber auch um die Schwierigkeiten, die eine solche automatische Annotation mit sich bringen kann. Wir werden besprechen, wie die automatische Erkennung von Eigennamen oder geographischen Namen (Named Entities) abläuft und im dritten Teil noch auf die automatische Syntax-Analyse von Texten eingehen. Viel Spaß!

...
3 vidéos (Total 63 min), 3 lectures, 2 quiz
3 vidéos
4.2 - Erkennung, Klassifikation und Linking von Named Entities17 min
4.3 - Syntaktische Analyse16 min
3 lectures
Lernziele Modul 45 min
Named Entities in der Praxis10 min
Material Modul 410 min
2 exercices pour s'entraîner
Wortarten und Grundformen automatisch bestimmen8 min
Testen Sie Ihr Wissen zu NER und Syntaxanalyse10 min
Semaine
5
3 heures pour terminer

Woche 5 - Manuelle Annotation und Evaluation von Korpusdaten

In Modul 5 beschäftigen wir uns mit der Frage, wie eine möglichst ökonomische Annotation aussehen kann und wie sich manuelle und automatische Annotation mit Hilfe von maschinellem Lernen ergänzen können. Wir besprechen außerdem, wie wir die Qualität bzw. die Genauigkeit der Annotation gewährleisten und evaluieren können. Im zweiten Teil geht es dann um das sogenannte "Crowdsourcing", wo über Online-Plattformen Daten für diverse Projekte gesammelt bzw. korrigiert werden. Viel Spaß in der vorletzten Woche!

...
2 vidéos (Total 52 min), 3 lectures, 1 quiz
2 vidéos
5.2 - Möglichkeiten und Probleme beim Crowdsourcing19 min
3 lectures
Lernziele Modul 55 min
Evaluationsmaße: Wie gut funktioniert unser Modell?10 min
Material Modul 510 min
Semaine
6
3 heures pour terminer

Woche 6 - Herausforderungen der Multilingualen Textanalyse

Im letzten Modul befassen wir uns mit multilingualen bzw. parallelen Korpora. Im ersten Teil geht es um die automatische Sprach-Identifikation in gemischtsprachlichen Korpora, die einen wichtigen Schritt bei der Verarbeitung der Texte darstellt. Im zweiten Teil geht es um die automatische Satz- bzw. Wortalignierung zwischen parallelen Texten in unterschiedlichen Sprachen. Viel Spaß in der letzten Woche!

...
2 vidéos (Total 30 min), 3 lectures, 1 quiz
2 vidéos
6.2 - Sprachübergreifende Alignierung17 min
3 lectures
Lernziele Modul 65 min
Vom Babelfisch zur maschinellen Übersetzung10 min
Material Modul 610 min
1 exercice pour s'entraîner
Fast geschafft: Sprachidentifikation & Alignierung12 min
4.8
3 avisChevron Right

Principaux examens pour Sprachtechnologie in den Digital Humanities

par DHNov 19th 2017

Sehr gut strukturierter Kurs! Man lernt viele aktuelle Methoden, Begriffe und Tools kennen, die man in dne unterschiedlichsten Projekten anwenden kann! Ein zeitnaher Kurs zu einem spannenden Thema!

Enseignants

Avatar

Martin Volk

Prof. Dr.
Institute of Computational Linguistics
Avatar

Noah Bubenhofer

Dr.
Institute of Computational Linguistics
Avatar

Simon Clematide

Dr. phil.
Institute of Computational Linguistics

À propos de Université de Zurich

Founded in 1833, the University of Zurich (UZH) is Switzerland’s largest university, with a cur­rent enrollment of over 26,000 students. Made up of seven faculties covering approximately 100 different subject areas, UZH is proud to offer the most comprehensive aca­demic program in the country....

Foire Aux Questions

  • Une fois que vous êtes inscrit(e) pour un Certificat, vous pouvez accéder à toutes les vidéos de cours, et à tous les quiz et exercices de programmation (le cas échéant). Vous pouvez soumettre des devoirs à examiner par vos pairs et en examiner vous-même uniquement après le début de votre session. Si vous préférez explorer le cours sans l'acheter, vous ne serez peut-être pas en mesure d'accéder à certains devoirs.

  • Lorsque vous achetez un Certificat, vous bénéficiez d'un accès à tout le contenu du cours, y compris les devoirs notés. Lorsque vous avez terminé et réussi le cours, votre Certificat électronique est ajouté à votre page Accomplissements. À partir de cette page, vous pouvez imprimer votre Certificat ou l'ajouter à votre profil LinkedIn. Si vous souhaitez seulement lire et visualiser le contenu du cours, vous pouvez accéder gratuitement au cours en tant qu'auditeur libre.

D'autres questions ? Visitez le Centre d'Aide pour les Etudiants.