Department of Theoretical and Applied Linguistics
Corpws Hanesyddol yr Iaith Gymraeg
Noddir gan grant ymchwil yr AHRB, rhif RE11900
Prif ymchwilydd: David Willis
Cymrawd ymchwil: Ingo Mittendorf
Nod y prosiect yw cynhyrchu corpws hanesyddol o destunau Cymraeg o'r cyfnod 1500-1850 ar ffurf electronig. Er bod sawl corpws o'r fath ar gael ar gyfer ieithoedd eraill megis Saesneg, Ffrangeg, Almaeneg a Gwyddeleg, mae adnoddau tebyg yn brin yn y Gymraeg. Bydd y proseict yn ymdrin â thestunau o'r cyfnod Cymraeg Diweddar Cynnar; mae prosiect tebyg i olygu llawysgrifau Cymraeg y bedwaredd ganrif ar ddeg ar y gweill ym Mhrifysgol Cymru.
Bydd y corpws yn cwmpasu amrywiaeth gyfoethog y testunau sydd ar glawr o'r cyfnod, gan gynnwys testunau a samplau o destunau o wahanol arddulliau ac o wahanol rannau Cymru. Bydd amrywiaeth arddull y corpws yn ei wneud yn arbennig o ddefnyddiol ar gyfer astudio newid ieithyddol. Ein nod yw darparu'r testunau ar ffurf hawdd i'w harchwilio i ymchwilwyr mewn astudiaethau Celtaidd ac mewn ieithyddiaeth hanesyddol. Bydd y corpws yn eu caniatáu i archwilio corff sylweddol o destunau am nodweddion ieithyddol arbennig neu am bynciau sydd o ddiddordeb llenyddol neu hanesyddol iddynt. Mae llawer o'r testunau y bwriedir eu cynnwys yn y corpws heb fod ar gael mewn argraffiadau modern, neu ar gael mewn argraffiadau sydd wedi cael eu diweddaru yn unig. Felly bydd y prosiect yn cynyddu'r nifer o bobl a gaiff ddefnyddio'r testunau dan sylw.
Bydd yr holl gorpws yn cael ei gynhyrchu mewn fformat sydd yn cydymffurfio â safonau Menter Amgodio Testunau (Text Encoding Initiative, TEI), ac fe fyddwn yn ychwanegu codau i'r corpws o fewn fframwaith y TEI er mwyn hwysulo ei ddefnyddio fel ffynhonell ddata ieithyddol. Dechreuodd y prosiect ym mis Chwefror 2001, ac ein nod yw ei gwblhau ym mis Ionawr 2004.
Byddwn ni'n dewis testunau mewn nifer o ddosbarthiadau er mwyn cynrychioli holl amrywiaeth arddull yr iaith Gymraeg. Er hynny, mae'n rhaid derbyn nad yr un yw rhychwant y testunau sydd wedi goroesi o bob cyfnod. Y dosbarthiadau sydd dan sylw yw: drama, llythyrau personol, baledi, rhyddiaith wleidyddol (didactig), ysgrythur, narratif hanesyddol, rhyddiaith adroddiadol, a rhyddiaith grefyddol.
Er nad yw pob dosbarth ar glawr ym mhob cyfnod y corpws, mae tri, sef rhyddiaith adroddiadol, narratif hanesyddol a rhyddiaith grefyddol, yn gyffredin ym mhob cyfnod a gynhwysir yn y corpws. Bydd y testunau hyn yn caniatáu i ddefnyddwyr olrhain datblygiad testunau o'r un haen o ran arddull drwy amser.
Am bob testun, byddwn ni'n cynnwys naill ai sampl nodweddiadol o tua 15,000 o eiriau neu'r holl destun os bydd hyn yn llai na 15,000 o eiriau. O ran dyluniad, bydd y corpws yn dilyn yn fras gonfensiynau a sefydlwyd ar gyfer Corpws Helsinki Testunau Hanesyddol Saesneg. Bwriedir creu corpws o tua 500,000 o eiriau mewn cyfanswm, gan ddefnyddio tua 35 o destunau. Bydd y corpws yn cynnwys testunau llawysgrif a thestunau printiedig fel ei gilydd.
Cyfnod arbennig o bwysig i'r iaith Gymraeg yw'r unfed ganrif ar bymtheg a'r ail ganrif ar bymtheg. Er bod rhai gwahaniaethau tafodieithol wedi cael eu darganfod mewn Cymraeg Canol, dyma'r adeg gyntaf lle mae gwahaniaethau tafodieithol yn amlwg ar raddfa eang; cyfnod hollbwysig yw hwn ar gyfer astudio tarddiad y tafodieithoedd Cymraeg fel y maent heddiw a chreadigaeth yr iaith safonol. Serch hynny, mae argraffiadau dibynadwy o destunau o'r cyfnod hwn yn brin. Un o gyfraniadau arbennig y prosiect fydd darparu testunau o'r cyfnod hwn i'r gynulleidfa ehangaf.
Wrth gwrs mae'r ffocws ar amrywiaeth yn arwain at broblemau hefyd. Er mwyn hwyluso ymchwil ar newid ieithyddol, mae'n hanfodol bod y corpws yn darlunio orgraff ac amrywiaethau graffigol y testunau gwreiddiol yn ffyddlon. Fodd bynnag, mae newid ieithyddol ac amrywiaeth orgraffol yn ei gwneud hi'n anodd darganfod unrhyw ffurf ieithyddol gyda sicrwydd. At hynny, yn achos testunau llawysgrif, mae'r golygydd yn wynebu cwestiynau golygyddol adnabyddus. Am resymau ymarferol, ni fydd hi'n bosibl ychwanegu codau ieithyddol i'r corpws ar raddfa eang; er hynny, rydyn ni'n ystyried y ffyrdd gorau i gynorthwyo defnyddwyr i ddarganfod y wybodaeth sydd angen.
Ar hyn o bryd, rydyn ni'n gweithio ar brosiect prawf yn trin tri o'r testunau mwyaf astrus: drama (anterliwt) o'r ail ganrif ar bymtheg ('Y Rhyfel Cartrefol', Llyfrgell Genedlaethol Cymru, llsg. Cwrtmawr 42), a dwy enghraifft o'r Ysgrythurau (allan o'r Testament Newydd (Llundain, 1567), a'r Beibl Cysegr-Lan(London, 1588)). Bydd y testunau hyn ar gael yn fuan.
