Software Tutoring in Speech User Interfaces

TamPub

Kuvailutiedot

dc.contributor.author Hakulinen, Jaakko -
dc.date.accessioned 2012-12-03T12:12:25Z
dc.date.available 2012-12-03T12:12:25Z
dc.date.issued 2006 -
dc.identifier.isbn 951-44-6802-3 -
dc.identifier.uri http://tampub.uta.fi/handle/10024/67664
dc.description.abstract Ihmisen ja tietokoneen välinen kommunikaatio on nykyään mahdollista myös puheen avulla. Tällaisia järjestelmiä kutsutaan puhekäyttöliittymiksi. Yleisimpiä kaupallisia puhekäyttöliittymiä ovat puhelinpohjaiset palvelut, esimerkiksi juna-aikataulut. Ensimmäiset tällaiset järjestelmät ovat käytössä myös Suomessa. Puheen ymmärtäminen tietokoneella on haastava ongelma ja rajoittaa puhekäyttöliittymiä, koska ymmärrys toimii riittävän luotettavasti vain rajatun kokoisilla sanastoilla, eikä puheen ja keskustelun tyyli voi myöskään olla yhtä vapaa kuin ihmisten välisessä vuorovaikutuksessa. Johtuen edellämainituista teknisistä rajoituksista, puhekäyttöliittymää käyttävän ihmisen tulee oppia järjestelmän rajoitukset. Yksinkertaisissa järjestelmissä tarvittava opastus voidaan upottaa itse puhekäyttöliittymään niin, että kone ohjaa keskustelua sopivilla kysymyksillä ja vihjeillä. Jos tällainen järjestelmä on onnistuneesti suunniteltu, käyttäjä vastaa luontevasti sen ymmärtämällä kielellä. Monimutkaisemmissa järjestelmissä tarvittavan opastuksen sisällyttäminen järjestelmän puheenvuoroihin on vaikeaa, koska pitkien ohjeiden esittäminen puheella on hidasta ja niiden muistaminen vaikeaa. Tällöin opastus tulee tarjota erillään itse käyttöliittymästä, esimerkiksi ohjekirjan muodossa. Tunnettu tosiasia kuitenkin on, että ohjekirjoja ei mielellään lueta. Tässä tutkimuksessa on kehitetty erilaisia ohjelmia, jotka opastavat uusia käyttäjiä puhekäyttöliittymän käyttöönotossa. Tällainen ohjelmallinen tuutori- tai yksityisopettaja opastus voidaan toteuttaa puheella niin, että käyttäjän ja järjestelmän lisäksi keskusteluun osallistuu käytön alussa opastajahahmo, joka neuvoo käyttäjää tarpeen mukaan. Opastus voidaan myös joissain tapauksissa tarjota käyttäen tekstiä ja kuvia, jolloin puheen ominaisuudet eivät ole rajoitteita. Opastusten suunnittelua on työssä lähestytty käyttäjien näkökulmasta toteuttamalla opastuksia olemassa oleviin järjestelmiin ja testaamalla ratkaisuja käyttäjien kanssa. Sekä puhepohjaisia että grafiikkaa käyttäviä opastuksia on kehitetty vaiheittain käyttäjiltä kerättyjen kommenttien ja kokemusten perusteella. Molempia opastustyyppejä on myös vertailtu perinteisiin tekstipohjaisiin ohjeisiin. Käyttäjätesteissä opastajat pystyivät opettamaan vuorovaikutuksen tyylin paremmin kuin tekstipohjaiset ohjemateriaalit, ja käyttäjien opetteluvaihe sisälsi vähemmän erilaisia ongelmia opastajan ohjauksessa. Puhekäyttöliittymät tarjoavat uudenlaisen tavan ihmisen ja teknologian vuorovaikutukseen. Puhe on käyttökelpoinen monissa tilanteissa, joissa perinteiset käyttöliittymät ovat ongelmallisia. Tutkimuksen tulosten perusteella opastajapohjainen lähestymistapa auttaa käyttäjiä omaksumaan tämän uuden vuorovaikutuksen helposti ja nopeasti. fi
dc.description.abstract Speech has been in use as a computer user interface for some time already. For more than two decades, speech-recognition-based services have been publicly available, and the number of available services has risen steadily. However, speech user interfaces have not reached the wide popularity sometimes hoped for or expected. This is due to the limitations of spoken human´s computer interaction. Many of these arise from the current computer technology available and our capabilities of building speech-based user interfaces. However, the very nature of speech imposes its own limits as well, which cannot be overcome. The biggest challenge with speech user interfaces is that the interaction objects are invisible. Therefore, users must know what objects and operations are available in each system, and what they are called. In human­human interaction, the unlimited use of natural language and the possibility of cooperative meta communication about the task enable us to work with each other so that, for example, collaborative problem-solving using speech is effective. Computers, on the other hand, can understand only limited subsets of natural language, and their communication skills are considerably weaker than those of people. For speech interfaces to be usable, existing systems either provide the necessary guidance to users as part of the user interface or require the users to learn about usage from some sort of guidance material. In speech-only interfaces, the guidance can be embedded in speech interaction via explicit prompts, hints, and confirmations. This makes small applications reasonably usable but larger applications and frequent use inefficient. The other option, external guidance material, is not favored ­ users tend not to read manuals, instead trying to learn by trial and error. In this study, software tutoring has been applied for speech user interfaces. A software tutor is a software component that teaches the use of a software application. A tutor can monitor users actions and adapt appropriately. The teaching happens in situ; the users learn about the application while using it. This kind of user guidance is particularly popular in computer and video games, whose users cannot be assumed to read manuals, since they want to start playing immediately. The study presents two kinds of software tutors: a speech-based tutor and multimodal tutors. The speech-based tutor is embedded in a speech interface for e-mail reading and provides guidance for new users. The multimodal tutors use text and graphics to teach the usage of a speech-based timetable system. The tutors are connected to the system so that they can, for example, visualize the spoken interaction in real time. The nature of the tutors, their technical solutions, the iterative development process, and formal evaluations are reported. The results show that the tutors can support new users better than the previously used static text-based guidance materials can. en
dc.language.iso en -
dc.publisher Tampereen yliopisto -
dc.relation.isformatof 951-44-6746-9 -
dc.subject puhekäyttöliittymät -
dc.subject opastus -
dc.subject käyttöohjeet -
dc.subject speech user interfaces -
dc.subject user guidance -
dc.subject software tutoring -
dc.title Software Tutoring in Speech User Interfaces -
dc.type.ontasot fi=Väitöskirja | en=Doctoral dissertation| -
dc.identifier.urn urn:isbn:951-44-6802-3 -
dc.relation.numberinseries 6 -
dc.seriesname Dissertations in Interactive Technology -
dc.oldstats 1274 -
dc.seriesname.electronic Acta Electronica Universitatis Tamperensis -
dc.relation.numberinserieselectronic 581 -
dc.publisher.electronic Tampere University Press -
dc.subject.study Vuorovaikutteinen teknologia - Interactive Technology -
dc.date.dissertation 2006-12-08 -
dc.onsale 0 -
dc.faculty fi=Informaatiotieteiden tiedekunta | en=Faculty of Information Sciences| -
dc.department fi=Tietojenkäsittelytieteiden laitos | en=Department of Computer Sciences| -

Viite kuuluu kokoelmiin:

Kuvailutiedot