Wybrane Posty

Co ciekawi mnie w muzyce? Zastanawialiście się kiedyś jakie czynniki powodują, że lubicie jakiś utwór? Dlaczego jest tak, że po pierwszym przesłuchaniu jakiejś piosenki jesteście w stanie zachwycić sie nią? W moim...

Czytaj dalej

Herbata - co i jak Herbata jest napojem, który towarzyszy nam na co dzień. Niewiele jest jednak osób, które przywiązują wagę do tego co i jak piją. Kupujemy ekspresówki, herbatki smakowe, czy też ziołowe. Kiedyś...

Czytaj dalej

Tortilla ziemniaczana z dodatkami Niedawno znalazłem przepis na tortillę ziemniaczaną i zainspirowało mnie to do poeksperymentowania. Jako, że samą tortillę robi się mniej więcej tak samo - ekperyment dotyczył tego, co na nią...

Czytaj dalej

Jestem jak Fin, czyli słowo o języku angielskim Języka angielskiego uczę się od wielu lat. W dzisiejszych czasach jego znajomość jest bezdyskusyjnie przydatna, a często wręcz wymagana. Większość młodych Polaków uczy lub uczyła się tego...

Czytaj dalej

Język (nie do końca) rozpoznawalny W poniedziałek, 15 września 2008 roku, zakończyłem oficjalnie pisanie pracy magisterskiej i złożyłem ją w dziekanacie. Jako, że nie wszyscy wiedzą o czym pisałem, postaram się przedstawić...

Czytaj dalej

Jestem jak Fin, czyli słowo o języku angielskim

Posted by EChO | Posted in Osobiste, Społeczeństwo | Posted on 26-02-2009

Tagi: ,

1

Języka angiel­skiego uczę się od wielu lat. W dzi­siej­szych cza­sach jego zna­jo­mość jest bez­dy­sku­syj­nie przy­datna, a czę­sto wręcz wyma­gana. Więk­szość mło­dych Pola­ków uczy lub uczyła się tego języka na różne spo­soby w swoim życiu. W szkole kła­dzie się naj­więk­szy nacisk na zna­jo­mość zasad języka — gra­ma­tyki, popraw­nej orto­gra­fii i wymowy. Jed­nak przy for­mu­ło­wa­niu myśli w tym języku poja­wiają się pro­blemy. Ja mia­łem sto­sun­kowo nie­wiele do czy­nie­nia z tym języ­kiem na co dzień w mowie. Wię­cej — w piśmie, szcze­gól­nie korzy­sta­jąc z Inter­netu. Dla­tego nie mam pro­blemu z popraw­nym pisa­niem po angiel­sku, czy też ze zro­zu­mie­niem arty­ku­łów, które czy­tam.
Ostat­nio, pró­bu­jąc uczyć się pod­staw języka fiń­skiego, natra­fi­łem na cie­kawy arty­kuł, napi­sany przez Fina, a doty­czący zna­jo­mo­ści języka angiel­skiego przez Finów. Pisze on:

„(…) in a typi­cal conver­sa­tion between people from dif­fe­rent nations, the Finn is still try­ing to for­mu­late his first gram­ma­ti­cally cor­rect sen­tence when others have chan­ged the topic a few times”,

czyli:

„(…) w typo­wej roz­mo­wie mię­dzy ludźmi o róż­nej naro­do­wo­ści, Fin jesz­cze cią­gle składa swoje pierw­sze gra­ma­tycz­nie poprawne zda­nie, pod­czas gdy inni zdą­żyli już zmie­nić temat wiele razy”.

To zda­nie dosko­nale oddaje to, co czuję pod­czas roz­mów po angiel­sku. Jest to o tyle ważne, że ten język jest w mojej pracy pod­sta­wo­wym języ­kiem komu­ni­ka­cji z pra­cow­ni­kami z innych kra­jów, a takie kon­takty są czę­ste.
Podo­bieństw mię­dzy Pola­kami i Finami w kwe­stii nauki języ­ków jest sporo. Nacisk na popraw­ność gra­ma­tyczną, na popraw­ność (mniej wię­cej) wymowy. Mamy też wyrazy, tzw. „false friends”, które brzmią podob­nie w angiel­skim, jak i w polskim/fińskim, ale zna­czą coś innego. Jed­nak zde­cy­do­wa­nie lepiej jest u Finów z osłu­cha­niem się języka angiel­skiego. Przede wszyst­kim, filmy w tele­wi­zji są tam nada­wane w ory­gi­nale, z pod­pi­sami. W Pol­sce nie­stety jest to cią­gle wyjątkiem.

Jeśli chce­cie wie­dzieć wię­cej — zaj­rzyj­cie na wyżej zlin­ko­waną stronę.

Język (nie do końca) rozpoznawalny

Posted by EChO | Posted in Technologia | Posted on 18-09-2008

Tagi: , , ,

5

praca magisterskaW ponie­dzia­łek, 15 wrze­śnia 2008 roku, zakoń­czy­łem ofi­cjal­nie pisa­nie pracy magi­ster­skiej i zło­ży­łem ją w dzie­ka­na­cie. Jako, że nie wszy­scy wie­dzą o czym pisa­łem, posta­ram się przed­sta­wić krótko całą historię.

Gdy pół­tora roku temu zaczą­łem się zasta­na­wiać na poważ­nie nad tema­tem pracy, mia­łem kilka spre­cy­zo­wa­nych punk­tów, według któ­rych chcia­łem sobie dobrać temat. Moją spe­cjal­no­ścią jest inży­nie­ria opro­gra­mo­wa­nia, ale w tej dzie­dzi­nie dowolny temat pracy wyda­wał mi się mało inte­re­su­jący. Posta­no­wi­łem pracę pisać w innym insty­tu­cie, a mia­no­wi­cie w Insty­tu­cie Sztucz­nej Inte­li­gen­cji i Metod Mate­ma­tycz­nych. Mia­łem nawet kon­kret­nie wybra­nego pro­mo­tora, u któ­rego chcia­łem pisać. Pod­sze­dłem do wyboru tematu dość ambit­nie. Wybór cze­goś łatwego i odtwór­czego mnie zupeł­nie nie prze­ko­ny­wał. W końcu ma to być moja pierw­sza publi­ka­cja naukowa z praw­dzi­wego zda­rze­nia. Dla­czego więc nie połą­czyć kilku dzie­dzin, które mnie inte­re­sują? Z racji wybra­nej spe­cjal­no­ści, głów­nym zada­niem w pracy miało być stwo­rze­nie pro­gramu. Chcia­łem napi­sać pro­gram, dzięki któ­remu prze­pro­wa­dził­bym bada­nia, któ­rych wyniki mogą się real­nie przy­dać, a jed­no­cze­śnie sam pro­gram mógł być roz­wo­jowy. Wyko­rzy­sty­wałby sieci neu­ro­nowe do kla­sy­fi­ka­cji cze­goś zwią­za­nego z dźwię­kiem. Na początku myśla­łem o roz­po­zna­wa­niu stylu muzycz­nego bada­nego utworu. Jed­nak kla­sy­fi­ka­cja gatun­ków muzycz­nych jest na tyle trudna dla czło­wieka, że kom­pu­ter tym bar­dziej nie będzie w sta­nie sobie z tym pora­dzić. Popro­si­łem więc pro­mo­tora o pomoc w wymy­śle­niu tematu w sam raz dla mnie. I pro­mo­tor wymyślił:

„Zasto­so­wa­nie sztucz­nych sieci neu­ro­no­wych do roz­po­zna­wa­nia języka mówią­cej osoby”

Temat spodo­bał mi się od samego początku. Wow! Zajmę się roz­po­zna­wa­niem języ­ków :-) . Oprócz dzie­dzin zwią­za­nych z dźwię­kiem, sztuczną inte­li­gen­cją i pro­gra­mo­wa­niem, mogę się zająć też bar­dzo inte­re­su­jącą mnie dzie­dziną — języ­ko­znaw­stwem. Cho­ciaż w ogra­ni­czo­nym stop­niu. Do tematu nie mia­łem żadnych zastrze­żeń, więc taki wła­śnie został ofi­cjal­nie przyjęty.

Jako rasowy pro­kra­sty­na­tor, na poważ­nie zają­łem się pracą dopiero w ostat­nim seme­strze ;-) . Wcze­śniej bar­dzo powoli gro­ma­dzi­łem lite­ra­turę, na któ­rej mógł­bym się oprzeć. Jed­nak lite­ra­tury takiej nie ma. Musia­łem się oprzeć na kilku anglo­ję­zycz­nych arty­ku­łach nauko­wych, trak­tu­ją­cych kon­kret­nie o tema­cie roz­po­zna­wa­nia języka. Reszta lite­ra­tury to publi­ka­cje o ana­li­zie i syn­te­zie dźwięku czy ogólne o samych sie­ciach neu­ro­no­wych. W dodatku publi­ka­cji o iden­ty­fi­ka­cji języka, w języku pol­skim, nie zna­la­złem żadnych. Dobrze, że oprócz pro­mo­tora zna­ją­cego się na sie­ciach neu­ro­no­wych, mia­łem też do kogo się zwró­cić w tema­cie samej ana­lizy dźwięku. Pani Ania dużo mi pomo­gła — dzięki niej opra­co­wa­łem naj­waż­niej­szą część pracy, czyli metodę eks­trak­cji cech głosu, któ­rymi potem mia­łem uczyć sieć neuronową.

Sama metoda powstała i została prze­te­sto­wana w Matla­bie jesz­cze przed waka­cjami. Zdą­ży­łem jesz­cze tylko napi­sać roz­działy teo­re­tyczne i prze­su­nąć ter­min odda­nia pracy na wrze­sień. Waka­cje upły­nęły mi na pisa­niu całego pro­gramu w C++ (jakieś 20% czasu) i jego testo­wa­niu (80% czasu, bo prze­cież nic nie może dobrze dzia­łać za pierw­szym razem ;-) ). Gdy po bólach pro­gram już powstał, prze­pro­wa­dzi­łem za jego pomocą bada­nia. Wresz­cie mogłem spraw­dzić jak się spra­wuje moje dziecko :-) .

Bada­nia były prze­pro­wa­dzone na prób­kach zdań w 6 języ­kach: pol­skim, angiel­skim, nie­miec­kim, wło­skim, hisz­pań­skim i rosyj­skim. Przy­go­to­wa­łem po 21 zdań w każ­dym z tych języ­ków i zaprzę­głem syn­te­za­tory mowy, żeby wyge­ne­ro­wały mi zda­nia z poprawną wymową. Dodat­kowo, przy­go­to­wa­łem próbki mowy żywego czło­wieka dla języka pol­skiego, angiel­skiego i rosyj­skiego. Zapo­wia­dało się cie­ka­wie… ale wyniki badań mnie nieco roz­cza­ro­wały. Przy ucze­niu wszyst­kich 6 języ­ków na raz, jakość roz­po­zna­wa­nia była bar­dzo niska. Od 20 do 50%. Z czego naj­go­rzej sieć roz­po­zna­wała… język angiel­ski. Naj­le­piej za to wło­ski. Wło­ski prak­tycz­nie wygry­wał w każ­dej kon­fi­gu­ra­cji. Naj­le­piej był roz­po­zna­walny (i to w pra­wie 85%) przy zesta­wie 3 języ­ków — pol­skim, wło­skim i hisz­pań­skim. Nie zdzi­wiło mnie to. Jeśli zna­cie melo­dię języka wło­skiego (a mój pro­gram wła­śnie ana­li­zuje melo­dię wypo­wia­da­nych zdań), to wie­cie, że każde zda­nie koń­czy się sko­kiem into­na­cji od dźwięku wyż­szego do niż­szego. Co wię­cej –bada­nia na prób­kach żywej ludz­kiej mowy wypa­dły nieco gorzej niż na prób­kach syntetycznych.

Czy więc ponio­słem klę­skę? W żadnym wypadku! Wycią­gną­łem wnio­ski, które pozwolą mi na udo­sko­na­le­nie algo­rytmu i prze­pro­wa­dze­nie kolej­nych badań. Na pewno nie porzucę tego co zaczą­łem. A świa­do­mość tego, że moja publi­ka­cja jest chyba jedyną taką w języku pol­skim, moty­wuje mnie dodat­kowo. W końcu inter­fejsy gło­sowe za kilka lat staną się bar­dzo popu­larne, a ja two­rzę pewien ważny wyci­nek tego, co w tych inter­fej­sach będzie imple­men­to­wane. Napi­sa­łem przy­zwo­itą pracę, z któ­rej jestem zado­wo­lony i która rokuje na przy­szłość. Jesz­cze czeka mnie obrona na początku paź­dzier­nika i wtedy będę mógł ode­tchnąć :-) . I z pew­no­ścią po obro­nie opi­szę bar­dziej szcze­gó­łowo wyniki badań, a także opu­bli­kuję swoją pracę w internecie.

Mam nadzieję, że Was nie zanu­dzi­łem, i że kogoś innego oprócz mnie też to zain­te­re­so­wało. W razie czego — pytaj­cie w komen­ta­rzach. Chęt­nie odpo­wiem :-)

Ortograficzna masakra

Posted by EChO | Posted in Społeczeństwo | Posted on 05-12-2006

Tagi: , , ,

2

Będąc inter­nautą od ponad 8 lat, na co dzień mam kon­takt z ludźmi z całego kraju. Z róż­nych regio­nów, w róż­nym wieku, zaj­mu­ją­cych się róż­nymi pro­fe­sjami. W więk­szo­ści są to ludzie mło­dzi — stu­denci, a cza­sem ucznio­wie. Każdy inter­nauta ma także pośredni kon­takt z innymi bio­rąc udział w dys­ku­sjach w Use­ne­cie czy też na forach. Zauwa­ży­li­ście jak więk­szość pol­skich inter­nau­tów pisze po polsku?

Na pierw­szy ogień pój­dzie orto­gra­fia. Nie jest to mocna strona inter­nau­tów. Pomi­jam już fakt pomi­ja­nia pol­skich zna­ków dia­kry­tycz­nych (co jest coraz rzad­sze wśród mło­dych), ale „żeby” nie pisze się przez „rz”. Dosyć strasz­nie wyglą­dają wyniki z pew­nego zapy­ta­nia w googlach — „(…) spo­śród około 654,000 dla zapy­ta­nia wogule”. W takich wyni­kach kró­lują oczy­wi­ście komen­ta­rze z róż­nych ser­wi­sów, fora dys­ku­syjne oraz blogi — tam, gdzie jest naj­wię­cej mło­dzieży. Jesz­cze kilka lat temu pięt­no­wano takie pisa­nie, szcze­gól­nie w Use­ne­cie. Teraz — pięt­nu­ją­cych jest zbyt mało jak na ogrom dysor­to­gra­fi­ków. Każdy z nich oczy­wi­ście jest w sta­nie poświad­czyć to kwit­kiem z poradni. Kwit­kiem pro­pa­gu­ją­cym leni­stwo języ­kowe. Po co na lek­cjach pol­skiego dyk­tanda, skoro i tak połowa uczniów ma teraz takie zaświadczenie?

Secundo — inter­punk­cja. To, moim zda­niem, naj­więk­sza zmora inter­nau­tów. Napi­sa­nie jed­nego zda­nia bez żadnych zna­ków prze­stan­ko­wych jesz­cze od biedy można znieść. Ale napi­sa­nie całego posta na forum czy też blogu, skła­da­ją­cego się z wielu zdań, jed­nym cią­giem? Masa­kra! Jeśli pró­bo­wa­li­ście kie­dyś prze­czy­tać taki wpis — wie­cie o czym mówię.

Czy wogule sa tu jacys chło­pacy bo ja tak to mam do nich pyta­nie zna­czy do was czy wy lubi­cie pla­sti­kowe lalki bar­bie z tip­sami z głu­pia gadtka i z kilo­gra­mem tapety na gębie pytam sie tak z ciekawosci

Po trze­cie — pisa­nie pseu­do­slan­giem. Czy też zauwa­ży­li­ście, że inter­net ostat­nio jest pełen swe­eeeet zio­mali, kof­fa­nych pshy­ja­ciooł i innych smo­ków wawel­skich? Tak, oto przy­szłość naszego narodu! Może ktoś kie­dyś napi­sze na ten temat pracę dyplomową?

Na koniec zosta­wiam perełkę:

Hey moooOye słJ­tha­śNe looodzJ­sqA! Wjem, JsH DAwno nJe pJsauAM, za co FAS bar­DZo, baRdZ psHe­pra­Aasham. Na peF­Fno TEn­sQnN­njLj­ś­cJE, Ay NOł DaTh (ale shpAn NJe? Ingljsh zJoOOom).

W sHQo­OouC Spox, moYA śReDnJA tho 5.2. CjE­sHY­THa sJem pra­af­fdA MOye QOff­fANe ZJo­mo­oOSje.
ALE, Jaq wjA­dOmO Ocenq NjE soM NAy­wa­shn­je­eeeEy­sheE. WasH­NIeYSh SOm sprA­fY­yYy sER­Do­oOShqOfFe, o tAQ, tHaQ, JA jeSTeM pAan Tjq-TTTAq, a zEeeGAr tho muy ZnaQ. Ło thaq, BBbb­BAR­dZOOo lllo­ooOBbb­bJam ThO­OOO OGloN­dAć.
ALlll­LeEe DO sedna SprAwY psHEFF­fo­Dzonc.…. Z Dawe­edQjeM cora­AAZ dzJwN­JeY. CzY­shbb on mnjEe ooOOn­jQAł? NJE­Da­aaaaf­FNo FfF­cja­łAm moooo poDa­aaaro­wAććć F prE­sEN­Cje QfJo­tqj, QtóR ZeeEEerF­fau­AmMmM fFF mOJM ogróDq„ OTshy­YwJ­ś­cjE z QoshO­NQam i zJeM­joN„„, a On mYy na tHo pOwJe­dzJał, sHE ooooofsHe­Eem, bard­DZo SjEm cje­sHy, alE pre­senTH nje mOshE psHy­Y­onć. I jaqoś THAq… pOLAsU gdzjEśśśśś sOOby i JOosH gggg­go­OOoo nJE fjdZJA­łaM. ŁEeeEeee.……
Mammm thE­rAS Doło­ooOSja­aaaa co jestH bAr­dZo nIe słj­thA­śNe i źLe rOB na ceReN. NaAaa dooof­FO­ooo pod­Th­Shy­Mo­OoyOm mnje jEdynjE WaSH sujt QoOooMm­MEn­tHA­aShYKj.
DzJE­NqyeM WaM z cAłEGO seRdoosHqa!

Jakiś komen­tarz? Bo mi powoli wszystko opada…