Spis treści Artykuł originalny « Poprzedni artykul Nastepny artykul »

Bardzo podobne słowa

Tre similaj vortoj

Orignał w języku EsperantoMaszynowe tłumaczenie na język polski

En lasta tempo kelkaj Esperantistoj ekinteresiĝis pri aŭtomata korektado en Programo Esperantilo. La vigla korespondado finiĝis per nova mesaĝ-grupo Komputila lingvistiko. La unua frukto de tiu kunlaboro estas korektita bazo de erarekzemploj Ekzemploj de eraroj, kiun mi uzas por testado kaj kiel teoria fonto de programado de korektilo.

Ĉar mi denove pensis pri aŭtomata korektado, mi decidis analizi la vortprovizon de esperanto je tre similaj vortoj. La analizo trovis vortoj, kiuj estas:

  • same longaj
  • sama unua kaj lasta litero
  • diferencas nur je unu litero
  • sen participoj

Mi analizis ĉiujn vortojn ĝis frekventaca grupo 15 de mia frekventeca bazo de vortoj. Ĉar la vortoj devenas de analizo de tekstaro, estas eble, ke kelkajn vortojn nun estas oftaj skriberaroj. Mi dividis la listojn je 3 kategorioj:

  • similaj: ĉiuj vortoj - nombro 10446
  • similaj sone: vortoj, kiuj simile sonas, do ili diferencas je litergrupoj (dt rl pb sŝ cĉ hĥ) - nombro 679. Tiuj vortoj kutime estas problemaj por azianoj.
  • similaj vide: vortoj, kiuj simile aspektas , do ili diferencas je litergrupoj (nm rn ao bh) - nombro 420

Mi nun ne scias, kiel oni povas uzi tiujn listojn en praktiko. Mi supozas, ke tiuj vortoj estas ofte intermiksitaj.

W ostatnim czasie kilku Esperantystów {ekinteresiĝis} o automatycznej korekturze w Programie Esperantilo. Rześka korespondencja skończyła się nowym {mesaĝ-grupo} językoznawstwo Komputerowe. Pierwszy owoc tej współpracy jest poprawioną bazą {erarekzemploj} Przykłady omyłek, którą użytkuję dla testowania i jak teoretyczne źródło programowania {korektilo}.

Ponieważ od nowa myślałem o automatycznej korekturze, decydowałem rozpatrywać słownictwo esperanto o bardzo podobnych słowach. Analiza znalazła słowa, które są:

  • zarówno dłudzy
  • taki samy pierwsza i ostatnia litera
  • różni się jedynie o jednej literze
  • bez imiesłowów

Rozpatrywałem wszystkie słowa do {frekventaca} grupy 15 od mojej {frekventeca} bazy słów. Ponieważ słowa pochodzą z analizy grupy tekstów, są przypuszczalnie, że kilka słów teraz są częste {skriberaroj}. Podzieliłem spisy o 3 kategoriach:

  • podobni: wszystkie słowa - liczba 10446
  • podobni {sone}: vortoj, kiuj simile sonas, do ili diferencas je litergrupoj (dt rl pb sŝ cĉ hĥ) - liczba 679. Te słowa zazwyczaj są problemowe dla Azjat.
  • podobni wizualnie: słowa, które podobnie wyglądają, więc oni różnią się o grupach liter (nm rn ao bh) - liczba 420

Teraz nie wiem, jak można użytkować te spisy w praktyce. Przypuszczam, że te słowa są często zamienione.

Artukuł został przetłumaczony w pełni maszynowo przez wolny program Esperantilo
Adres kontaktowy:
mail@xdobry.de