Innhold
1. Innledning
2. Referanse- og fulltekstdatabase
3. Java
4. Arbeidet med tesaurus og UDK
5. Arbeidet med TRIP
6. IPG - Internet Pointer Guide
7. Annet arbeid
8. Oppsummering og takk
Og dermed var prosessen initiert. Søknader, møter, utveksling av elektronisk post og samtaler med øvrighetspersoner både her og der, ga som resultat at DTV ønsket meg velkommen som gjest i 6 måneder fordelt med 3 måneder på hver side av sommerferien i 1997.
Min egen institusjon betalte meg full lønn i perioden og DTV og Nordinfo sørget for å dekke de merutgiftene som fulgte med å ha to husholdninger (DTV 4 måneder, Nordinfo 2 med sitt mobilitetsstipendium).
På forhånd hadde jeg uttrykt ønske om å få arbeide med det nye artikkelsystemet deres, der bibliografiske referanser fra flere kilder kombineres i en felles database med lenker til fulltekstversjoner av artiklene i bildeformater (også fra flere kilder). I og med at prosjektet også omfattet data fra INSPEC var dette av spesiell interesse for det stedet jeg kom fra. Der har vi i lengre tid ønsket INSPEC-data gjort tilgjengelig på våre brukeres arbeidsplass. Men foreløpig har vi måttet nøye oss med å ha dataene tilgjengelig på CDrom utelukkende i bibliotekets lokaler.
Et annet område jeg ytret ønske om å få arbeide med, var å forsøke å lage et bedre brukergrensesnitt basert på DTVs UDK-klassifikasjon og tesaurus. Jeg har i lengre tid syntes det var synd at alt det arbeidet som legges ned i indeksering og klassifikasjon i bibliotekene er så vanskelig tilgjengelig for brukerne: kodene er vanskelige å forstå og ofte er det et stort skille systemmessig eller rent fysisk mellom klasseskjema og katalog (i motsetning til den systematiske kortkatalogen).
Fra DTVs side var det ønske om at jeg skulle arbeide med installasjon av og forsøk med databasesystemet TRIP, dels for artikkelprosjektet, dels for NWI-prosjektet (NWI = Nordic Web Index).
Jeg ønsket selv også å benytte tiden til å lære meg programmeringsspråket Java som jo er på alles lepper for tiden, men som er nokså omfattende å sette seg inn i, enn si lage noen fornuftige applikasjoner.
Tiden ved DTV kom rett etter at jeg i noen måneder hadde arbeidet med kataloghistorie, katalogiseringsregler og metadata, noe som også fikk konsekvenser for hvordan tiden ble brukt.
I mitt eget bibliotek fikk jeg bare 50 % vikar noe som medførte at deler av arbeidet måtte følge meg til Danmark. Men det var også interessant å merke at enkelte deler av arbeidet ville fulgt meg uansett hvor i verden jeg hadde vært : nemlig å følge med i epostlister og føre diskusjoner og utveksle erfaringer med kollegaer.
Da jeg kom til UDV var Mogens Sandfær flyttet til Strasbourg og Anders Ardö (fra NetLab ved UB2 i Lund) hadde overtatt som leder. Dette bare understreket gruppens flernasjonale preg. Av 7 medlemmer var bare 3 danske, forøvrig var Frankrike, Irak, Sverige og Norge representert. Praten i gruppen gikk derfor på engelsk.
En annen gjest i UDV - Bjarne Andersson fra Roskilde Universitetsbibliotek - begynte samme dag som meg, så vi fikk under ledelse av Anne Cordsen en felles omvisning på hele DTV.
På DTV ble jeg plassert på et stort kontor i et maskinmiljø jeg ikke tidligere var vant med. Hjemme har vi driftsavdelinger som sørget for all installering av programvare, de siste versjoner, oppsett av maskiner osv. I UDV er man sin egen systemadministrator. Vanskelighetene ved dette ble overkommelige med den gode hjelpen jeg fikk fra Salam Shanawa og Kim Nørregaard Jensen.
I det følgende vil jeg ta for meg en del av de prosjektene jeg arbeidet med eller kom i kontakt med i løpet av tiden ved DTV.
Dette vil legge grunnlaget for en tjeneste for artikkelleveranse som skal tilbys DTVs brukere og eksterne brukere som er villig til å betale.
Prosjektet er nokså ambisiøst av flere grunner.
For det første er de bibliografiske dataene av nokså varierende kvalitet, både innenfor en enkelt kilde og i forhold til de andre kildene. I tillegg er det store overlapp mellom kildene. Dette forholdet stiller store krav til programvaren som skal kombinere dataene, finne dubletter og gjøre dataene konsistente som helhet.
For det andre er det ambisiøst for et bibliotek å utvikle en slik tjeneste i en nettverden der stadig flere kommersielle leverandører tilbyr liknende tjenester.
Databasesystemet som benyttes heter Zebra (utvikles av Indexdata). Min oppgave i forhold til dette systemet var å foreslå mulige systemløsninger for å representere dataene innenfor en annet databasesystem - TRIP - som jeg har erfaring med fra tidligere.
Hovedideen er å tilby brukeren mekanismer for søking, fokusering, browsing, annotering og søkehistorikk (over flere sesjoner).
I et slikt system vil det selvsagt være en skjerm for vanlig søking (se f.eks illustrasjonen under Trip-arbeidet nedenfor). Her vil jeg bare presentere enkle ideer som gir brukeren mulighet for å forfølge sine søk over et lengre tidsrom.
I figur 1 vises en situasjon der brukeren etter et søk har en treffliste foran seg. Dersom søket var vellykket, vil brukeren både ha anledning til å lagre søket for seinere gjenfinning og til å annotere søket. En slik funksjonalitet må selvsagt koples til bruk av en indeksert database der annotering, brukernavn, dato og søk kan oppbevares.
Figur 1 : Lagring og annotering av søk med treffliste.
Det kan også tenkes en mulighet for brukeren til å markere de mest relevante treffene i en treffliste og be systemet om å generere et søk ut fra dette utvalget. Å utvikle en slik funksjon vil være en egen forskningsoppgave !
I figur 2 vises en situasjon der brukeren blir presentert for en fullstendig referanse og der det gis mulighet for å plukke ut flere bibliografiske elementer for å fokusere nettopp på disse. Dette behøver ikke være begrenset til emnemessige elementer slik figur 2 viser, men kan også omfatte deler av den deskriptive katalogiseringen. I de fleste www søketjenester gis det bare anledning til å forfølge én av et utvalg lenker, meningen her er at man skal kunne gjøre et multippelt valg.
I figurene 3 og 4 vises forskjellige muligheter for gjenbruk av tidligere søk. I "gamle dager" var SDI-tjeneste en selvfølgelighet, men den forsvant i dragsuget av de store online-baser. Nå er den i ferd med å komme tilbake via såkalte agenter. Muligheten bør tilbys innenfor de bibliografiske systemene også. Her er det tenkt at brukeren kan be om nye referanser som er kommet til siden søket ble foretatt forrige gang, gjenta det gamle søket eller rett og slett be om alt. Forutsetningen er selvsagt at postene i den bibliografiske basen har en eller annen form for datostempel.
Figur 2: Fokusering på elementer i beskrivelsen.
Med muligheten for å spare på utførte søk, må også muligheten for å fjerne, kombinere og redigere tidligere søk følge. Dette er illustrert på en enkel måte i figur 4.
Figur 3: Gjenbruk av tidligere søk.
Tilsammen utgjør disse mulighetene et verktøy for brukeren til å håndtere sine litteratursøk over tid.
Figur 4: redigering av tidligere søk.
Mine egne erfaringer med programspråk var fra før i hovedsak begrenset til Simula, Pascal og Fortran. Java er språkfilosofisk i slekt med Simula, men syntaktisk svært likt C++, alle tre går under betegnelsen objektorienterte språk.
Ved å dra til DTV hadde jeg håpet å komme i et aktivt Java-miljø, der opplæringen kunne skje i samspill med andre. Men det viste seg at UDV fortsatt lå i startgropen på dette feltet og derfor ble det en noe ensom og tidkrevende virksomhet å arbeide seg såpass inn i språket at det kunne brukes som verktøy. Men Bo Frese Rasmussen fulgte godt med på Java-utviklingen på nettet og kom med mange gode tips og nye versjoner.
Java-dokumentasjonen er omfattende. Det fins et vell av bøker som behandler forskjellige aspekter, det fins fullstendig (kortfattet) beskrivelse av språket via WWW, det fins tidsskrifter og news-grupper. Det er rett og slett overveldende. Det er umulig å sette seg inn i et slikt univers på noen få måneder, så det ble mer et spørsmål om å velge ut de delene av Java som kunne løse de oppgavene jeg stilte meg og begrense seg til det.
Jeg rettet arbeidet mot AWT (Abstract Window Tools), en java programpakke som inneholder verktøy for å sette opp vindusbaserte grensesnitt med knapper og felter. Dessuten måtte jeg også lære meg en del om kommunikasjon i og med at dataene som skulle behandles (tesaurus og katalog, se nedenfor) befant seg på andre maskiner.
Mønster Eksempel Index term Partielle differensiallikninger BT broader term BT Differensiallikninger UF Used for UF Diff-likninger NT narrower terms NT Elliptiske differensiallikninger RT related terms Hyperbolske differensiallikninger SN scope note
Her er det hierarkiske aspektet (både generisk og partitiv inndeling) ivaretatt av relasjonene BT og NT (bredere og snevrere begreper), mens den sideordnende relasjon ivaretas av RT. Synonymkontrollen foregår gjennom bruk av UF-relasjonen. "Scope note" er en forklarende note som kan si noe om f.eks bruken av den aktuelle indekstermen.
I utgangspunktet trodde jeg at DTV brukte både UDK og en tesaurus av den klassiske typen som separate kategoriseringsverktøy. Men det viste seg ikke å være tilfellet.
På DTV er klasseskjema (UDK) og emneord smeltet sammen og dette kalles DTVs tesaurus. Den hierarkiske funksjonen ivaretas dels av UDK-tallets oppbygning (jo flere siffer dess snevrere begrep) og dels av emneord knyttet til de enkelte UDK-tall. Disse emneordene representerer en ytterligere detaljering av det aktuelle UDK-tallet.
Sideordnende relasjoner er representert dels ved reelle emnemessige henvisninger, dels ved relasjoner som viser til tidligere bruk av enkelte UDK-tall (der dette har endret seg).
En typisk innførsel i DTVs alfabetiske skjema kan se slik ut :
Mønster Eksempel
UDK-tall 006
TE termer TE Standardisering
synonym Normarbejde
NT Nøjere termer NT Rekommandationer, udarbejdelse
RT Relaterte termer RT Standardisering i virksomheder 658.51
TU tidligere UDK TU 389.6 Standardisering *** før 1982
HG Hyldegruppe HG 006 Standardisering
NO forklarende note NO Standarder (bestemte) står i særsamlinger
Utfra eksemplet vil man under 389.6 finne TU-relasjonens invers (NU):
389.6
TE Standardisering *** før 1982
NU 006 Standardisering
HG 389.6 Standardisering, ældre litt.
En mer detaljert presentasjon av DTVs tesaurus fins via
http://www.dtv.dk/tools/tesaurus/tesaurus.htm.
Mitt mål ble å forsøke å utnytte både de hierarkiske og sideordnende relasjoner på en brukervennlig måte gjennom et brukergrensesnitt i et pek og klikk miljø med minst mulig skriving fra brukerens side. Grensesnittet skulle kombinere oppslag i klassifikasjonssystem og katalog.
Da jeg kom til DTV ble jeg straks innlemmet i DTVs tesaurusgruppe - under ledelse av Inger Høy Nielsen. I tillegg sørget Birthe Krog for å finne fram til de personene ved DTV som jeg hadde behov for å diskutere med, f.eks Marianne Meister som forsynte meg det jeg trengte av UDK- og tesaurusdokumentasjon.
Tesaurusgruppen var i ferd med å avslutte arbeidet med en revisjon. Å delta i denne gruppens diskusjoner var en nyttig erfaring for meg, samtidig som jeg kunne holde gruppen orientert om mine egne tanker om brukergrensesnitt og å få tilbakemelding.
Tidligere hadde tesaurusen og klasseskjemaet bare foreligget i trykte versjoner i en alfabetisk og systematisk liste i bokform. Den nye utgaven var det meningen å presentere alfabetisk og systematisk versjon i WWW, men uten direkte koplinger til katalogen. I tillegg er det planlagt utgivelser i elektronisk form og i trykt form ved behov (publishing on demand).
Søking i den nye versjonen ville bli begrenset til de mulighetene som er innebygget i web-leserprogrammene. Materialets størrelse gjorde også at det for begge versjoners tilfelle måtte deles opp i flere filer av hensyn til responstid. Dette gjør det ekstra komplisert å slå opp.
Den alfabetiske delen fins via http://www.dtv.dk/tools/tesaurus/indexta.htm, den systematiske via http://www.dtv.dk/tools/tesaurus/indexts.htm.
Ved dette skillet var det også lettere å skille ut kommunikasjon knyttet til systemet. Dette er forsøkt illustrert i grove trekk i figur 5.
Det hadde vært ønskelig med kommunikasjon basert på z39.50-protokollen, ikke minst fordi Bo Frese Rasmussen arbeidet med en Java-basert z39.50-klient i tilknytning til et annet prosjekt. Men dette lot seg ikke gjøre av den enkle grunn at Aleph-versjonen ved DTV ikke har noen server basert på denne protokollen. Dette vil endre seg når den nye versjonen (ALEPH 500) blir installert. Se forøvrig om kommunikasjonen nedenfor.
Figur 5 : Enkel systemskisse.
Programmer skrevet i versjon 1.0 kunne også brukes som java-applets i www. Men ingen www-lesere ga støtte for java 1.1 på dette tidspunkt. Derfor sto valget i fortsettelsen mellom:
I det første tilfellet ville jeg jo få opp noe i www som virket, men i lengden vil det være håpløst å vedlikeholde noe i gamle språkversjoner.
Jeg krysset derfor fingrene og valgte løsning 2 i håp om at ihvertfall Netscape ville gi støtte for Java 1.1 i løpet av den tiden jeg var ved DTV. Når jeg skriver "ihvertfall", så bunner det i at Microsoft med sin Internet Explorer på et tidspunkt i høst så ut til å ville gå sine egne veier med Java, noe som har ført til juridiske konflikter med Sun (utvikleren av Java).
Konstruksjon og dekonstruksjon av disse datastrukturene bød ikke på spesielle problemer, men å få sendt det over til tjeneren og å få et fornuftig svar ved hjelp mitt noe begrensete kjennskap til Java, var problematisk. I tjenerloggen kom det meldinger av typen "committed suicide" og "received critical error", som i klartekst betyr at dataene må ha blitt korrumpert på veien. I tre uker forsøkte jeg å trenge gjennom dette.
Jeg var nær ved å gi fullstendig opp, da min kollega - Bjarne Andersson - foreslo å ta hele tesaurusen inn som data i programmet. Dette førte til at jeg startet et arbeide med å omformattere tesaurusdataene fra den html-formen som foreligger på www (se lenker ovenfor) til noe som kunne brukes i programmet, men før jeg rakk å fullføre dette, så fikk jeg ideen med å legge hele tesaurusen inn i mitt lokale databasesystem i Oslo (TRIP). I løpet av en dag var dataene på plass, søkbare og tilgjengelig i WWW. Kommunikasjon her var basert på en protokoll som jeg selv definerte og implementerte i begynnelsen av 1994 og som brukes til Informatikkbibliotekets katalog i WWW (se http://www.ifi.uio.no/ifibib/ifibib.html(vår katalog) og http://www.ifi.uio.no/~knuthe/dok/http_prog.html (protokollbeskrivelse)).
Jeg hadde javaprogrammet liggende på en lokal www-tjener og jeg skulle kommunisere dels med et databasesystem ved Universitetet i Oslo (tesaurusen) og dels med et ved DTV (katalogen). Så programmet slik det foreligger som frittstående applikasjon, kan ikke brukes som applet i WWW.
For å komme rundt dette sikkerhetsproblemet, må man lage en såkalt "gateway" (en formidler) på den maskinen som java-programmet hentes fra. Dette hadde jeg ikke mulighet for å få utført og testet med de versjonene av Java og Netscape jeg hadde tilgjengelig på DTV, men i skrivende stund er jeg i ferd med å teste ut en slik løsning i Oslo.
I figur 6 vises situasjonen etter at brukeren har skrevet inn (i øverste felt) og søkt på kontor (høyretrunkert) ved å klikke på search-knappen.
Resultatet vises i feltet under som alle relevante UDK-tall med tilhørende beskrivelse. I nederste felt vises hvor mange treff det var i alt og hvor mange som vises. Brukeren kan selv bestemme hvor mange treff som skal vises ved valg i options-menyen (10 i dette tilfellet). Hadde det vært flere treff, kunne brukeren hente de neste ved å klikke på ">"-knappen til høyre i skjermbildet.
Som det går fram av lista, er ordet kontor ikke med i alle beskrivelsene. Det betyr bare at ordet er med i en eller annen relatert term for det aktuelle UDK-tallet.
Ved å klikke på en linje i trefflista markeres den og brukeren kan nå velge mellom forskjellige måter å gå videre på enten i tesaurusdata eller i katalog.
Figur 6: Et søk på kontor? i DTVs tesaurus.
I figur 7 vises resultatet av å klikke på "Focus"-knappen (i figur 6-situasjonen). Her vises hele beskrivelsen av UDK-tallet med alle tilhørende relasjoner. Det går fram at det er en sideordnet relasjon fra "Skrive- og trykkemaskiner" til "Kontormaskiner" og det var den siste termen som ga treff. Igjen er det slik at linjer kan markeres for å gå videre enten i tesaurus eller i katalog. Dersom linjen inneholder et UDK-tall, brukes dette i den videre behandling (søk i tesaurus/katalog).
Fig 7: Fokusering på på beskrivelse av et UDK-tall.
I figur 8 vises resultatet av å klikke på "Context"-knappen (i figur 6-situasjonen). Resultatet vises som UDK-tallets (681.6) hierarkiske plassering (alle overordnete og underordnete tall på nærmeste nivå).
Denne funksjonaliteten voldte meg en del hodebry (og jeg er slett ikke fornøyd foreløpig). Hovedgrunnen til dette er at DTVs tesaurus mangler nivåer i enkelte hierarkier. F.eks : 684.4 Møbelfremstilling. Nærmeste overordnete i UDK-hierarkiet til denne er 6 Anvendt naturvidenskab. Verken 68 eller 684 er brukt i DTVs UDK-tabell. Slike tilfeller fins flere andre steder. Ekspansjon av et UDK-tall kan derfor bli problematisk. Ved ekspansjon av 6 Anvendt naturvidenskab kunne man da lett få 61 Lægevidenskab, Medicin (lægevidenskab) på linje med 684.4 Møbelfremstilling.
Følges reglene i UDK fins underordnete ved å ekspandere med ett siffer (evt. prefikset med et punktum) eller ved ulike utvidelser markert ved spesialtegn ( /, :, ( ). Med utgangspunkt i det UDK-tallet som skulle ekspanderes valgte jeg å lage en begrenset mengde med mulige kandidater (alle utvidelser med spesialtegn og alle utvidelser med ett siffer (høyst 20)). Disse kandidatene ble sjekket mot tesaurusen. Dersom en kandidat ikke eksisterte i tesaurusen, ble det sjekket om det fantes utvidelser av UDK-kandidaten ved trunkert søk. I så tilfelle ble de korteste utvidelsene tatt med i resultatlisten.
Denne metoden krever mye kommunikasjon og det gir uakseptable svartider som vil øke når kommunikasjonen i tillegg skal gå via en gateway. For å bøte på dette vil det muligens være lurt å ta en komprimert versjon av UDK-tabellen (bare eksisterende UDK-tall) inn som data i programmet og gjøre en rask sjekk der før man henter resten av dataene knyttet til UDK-tallet fra databasen.
Til nå har jeg beskrevet funksjonalitet knyttet til oppslag i tesaurusen og UDK-systemet. Når brukeren har kommet så langt i dette materialet at et oppslag ønskes forfulgt i katalogen, kan hun markere oppslaget og bruke ALIS-knappen. K-vinduet kommer da i forgrunnen og det blir utført et søk på det UDK-tallet (eller den termen) brukeren har markert. Denne overgangen vises i forholdet mellom figur 8 og 9.
Fig 8: UDK-tallets hierarkiske plassering.
Figur 9 viser K-vinduet. I dette vinduet utføres søk i katalogen og trefflister og referanser blir presentert. Søkemulighetene er i dette eksperimentet innskrenket til søk i felt for UDK-tall og emneord, men i en full versjon må også de andre søkemulighetene være tilstede (tittel, forfatter etc).
K-vinduet har tre knapper knyttet til bruk av tesaurusen:
Fig 9: Søk i katalogen på UDK-tallet 681.6
Broaden. Et klikk på denne medfører automatisk et trunkert søk på det sist brukte UDK-tall modifisert et nivå opp i hierarkiet.
Narrow. Et klikk på denne bringer T-vinduet i forgrunnen og der vises hvilke detaljeringsmuligheter som fins på de UDK-tallene som er inneholdt i sist viste post. Man får samme effekt som om man brukte "context"-knappen for alle UDK-tallene i referansen.
Explain. Denne knappen gir brukeren mulighet for å trekke med seg UDK-tallene fra referansen over til T-viduet og få dem forklart og å arbeide videre med dem der.
Responstid
Responstiden er i øyeblikket for lang både når det gjelder "context"-funksjonen og søking i katalogen. Den første kan utbedres ved å legge om både logikken i programmet og ved å senke behovet for kommunikasjon ved å ta deler av UDK-dataene inn i programmet. Den andre er avhengig av belastningen på katalog-tjenerenSøkehistorikk
I T-vinduet er det gode funksjoner som gir brukeren mulighet til å gå fram og tilbake i trefflister og mellom trefflister. Alle resultater tas vare på etterhvert som de framtrer. I K-vinduet er det foreløpig bare historikk knyttet til siste treffliste.Kommunikasjon
Det er en stor svakhet å basere kommunikasjonen på tolkning av html-filer slik det gjøres i katalogsøk. Både katalogsøk og tesaurussøk bør på et senere tidspunkt være basert på standardprotokoller (z39.50).Integrasjon med øvrige søkemuligheter
På det nåværende tidspunkt er programmet rendyrket på kombinasjon mellom klassifikasjon/emneord og katalog. Slik bruk av UDK-tabell og tesaurus bør integeres med det øvrige søkebrukergrensesnitt. Dersom begge er tilgjengelig i www, kan veien dit bli kort.
Biblioteksintern bruk
Et godt oppslagsverk for klassifikasjonssystem og emneord burde også knyttes til den interne prosessen med klassifikasjon og emneordssetting. Ved å klikk-kopiere data (UDK-tall og emneord) inn i de bibliografiske postene sikres katalogens konsistens, noe som på et seinere stadium fører til et kvalitetsmessig bedre søk.Bedre visning av mulighetene i hierarkiet.
I ulike vindusbaserte operativsystemer og f.eks i Netscape bokmerkeredigering er det fine verktøy for framvisning av hierarkiske data (filer og filkataloger, bokmerker i mapper).
Figur 10: Bokmerkehierarki presentert i Netscape v.4.04
Det ville vært ønskelig med tilsvarende mekanismer for å vise hierarkiene i UDK også. Blant annet muligheten til direkte å se om et UDK-tall lar seg utvide, før man eventuelt setter i gang en prosess med å forsøke å hente dataene i det underliggende hierarkiet. I tillegg kunne man vise antall treff i katalogen, når UDK-tallet sist fikk tilvekst.
I løpet av våren 1998 lanserte Java nye klasser for å representere trestrukturer (Swing). Dette gjorde det mulig i etterhånd å vise UDK-hierarkiet etter ovennevnte mønster slik figur 11 viser. En slik presentasjon er foreløpig ikke mulig via netscape (se over om problemer med versjonsbalanse).
Figur 11: DTVs UDK-tabell presentert som dynamisk trestruktur
RUbs tesaurus og katalog
Gjennom samarbeidet med forskningsbibliotekar Bjarne Andersson fra Roskilde Universitetsbibliotek (RUb) fikk jeg tilgang til også dette bibliotekets tesaurus som foreligger i to-språklig versjon (dansk og engelsk). Bjarne formatterte datene etter mine spesifikasjoner og dermed var det mulig å søke to tesauri med forskjellig utbygningsgrad i de forskjellige fagområdene. De to tesauri kan søkes sammen eller hver for seg. Dette gjorde det mulig å søke på engelske tesaurustermer i DTVs katalog som ikke hadde vært mulig tidligere.En naturlig utvidelse er å inkludere RUbs katalog i dette systemet og muligvis andre kataloger og emneordsregistre. Men en slik videreutvikling må være basert på standard kommunikasjonsprotokoller.
I figur 12 er "alle felt" en pop-up-meny som gir anledning til å velge søking i spesifikke felt (forfatter, titel, etc). "post" gir anledning til avgrensninger gitt av ovennevnte datastruktur.
Den eneste haken ved det er at det kan bli vanskelig for sluttbrukeren å forstå nivåforskjellene og til å bruke det for hva det er verdt.
Figur 12 : Potensielle søkemuligheter med trip i WWW.
Med utgangspunkt i programvare laget av en tidligere gjest ved UDV (Lian Yachun), laget jeg en trip-tjener (i programspråket C). Denne rakk jeg ikke å teste i forhold til artikkelprosjektet, men en mindre test ble utført med det danske datagrunnlaget for Nordic Web Index.
I slike søkemaskiner er det viktig med rangering av søkeresultatene - det mest relevante bør presenteres først. Dette krever rangeringsalgoritmer. Trip har slike, men de er (meg bekjent) begrenset til treffmengder på under 1000 treff. Dermed vil de ikke få anvendelse før brukeren gjennom sitt søk allerede har avgrenset tilstrekkelig.
Systemet heter Internet Pointer Guide (se http://www.dtv.dk/ipg/). Det er et yahoo-liknende system skrevet i perl, med gode muligheter for hierarkisk ordning av informasjon og søking i materialet. Det som ikke kommer fram for vanlige, eksterne brukere i www er hvor enkelt det er å ta imot forslag om nye lenker fra brukerne og behandle disse (addere lenker) og hvor enkelt det er å administrere med mulighet for å flytte lenker, duplisere dem til flere steder i hierarkiet. Systemet inneholder rikelige med statistikk- og kontrollmuligheter.
På DTV fikk jeg stifte nærmere bekjentskap med de interne delene av systemet. Personlig har jeg et sterkt ønske om at min egen institusjon skaffer seg denne programvaren.
Salam presenterte dette systemet på et seminar i Lund høsten 1996 og et kort resyme fins via http://www.dtv.dk/ipg/ipi.htm.
Faglig har det vært utrolig deilig å disponere sin tid (nesten) fullt ut til det jeg hadde lyst å gjøre, å arbeide til jeg enten ble trøtt eller sulten hver dag, uavhengig av om det er hverdag eller ukeslutt. Jeg må riktignok innrømme at jeg på slutten begynte å savne de hjemlige omgivelser og den direkte kontakten med brukerne som jeg har i Informatikkbiblioteket.
Da jeg begynte 1.april syntes jeg at jeg hadde et hav av tid foran meg. Nå mener jeg at 6 måneder kanskje var i korteste laget. For å gjøre et skikkelig arbeid, trengs mer tid. Man trenger et par måneder bare til å komme inn i miljøet både sosialt og arbeidsmessig før man kommer ordentlig i gang.
Jeg kommer gjerne igjen !
Jeg vil takke Danmarks Tekniske Videncenter og bibliotek for deres
gjestfrihet og støtte til oppholdet og alle ansatte på DTV jeg kom i
kontakt med for deres imøtekommenhet. Jeg vil også takke Nordinfo for
deres støtte til oppholdet og Universitetsbiblioteket i Oslo for
velvillig behandling av min søknad om permisjon med full lønn. Sist,
men ikke minst, vil jeg takke min sjef Tor Blekastad som er utrettelig
i sitt arbeid for å legge forholdene til rette for sine ansatte hva
enten det gjelder lønn eller arbeidsforhold.
Noen litteraturreferanser