Søppelpostfilter
Det engelske ordet for søppelpost har opphav i ein klassisk Monty Python-sketsj.
Ein dag kom dette tilbodet ramlande inn i e-postsystemet: «Dear sir/madam, I have decided to seek confidential cooperation with you for the execution of the deal described here. I have discovered an unclaimed fund totaling US $ 3.5 million that belongs to a customer who unfortunately lost his life and entire family in a car accident.»
Vidare vert vi lova ein stor del av desse pengane viss vi oppgjev ein del personleg informasjon. Men dette flotte tilbodet kom aldri inn i e-postkassa vår. Det vart stoppa av e-postfilteret som Universitetet i Bergen har sentralt.
Det skal ikkje mykje til før e-postadressa di er spreidd for alle vindar. Det er nok å kjøpe eit produkt på ein utanlandsk nettstad, så dukkar slike meldingar opp. E-postadressene til oss universitetstilsette ligg ope på vevsider og er lette å få tak i. Adressene vert samla i databasar som blir brukte til masseutsendingar av tvilsame økonomiske forslag, tilbod om seksuelle tenester og meir uskuldige tilbod som invitasjon til falske akademiske konferansar. Titusenvis av slik e-post strøymer til e-postsystemet ved universitetet kvar einaste dag.
For mange ville slik e-post ha vore eit uhandterleg problem om vi ikkje hadde hatt søppelpostfilter. Kampen mot misbruk av opne kommunikasjonskanalar har medført at alle større verksemder i dag bruker slike filter. Du kan òg byggje opp ditt eige søppelpostfilter i eit privat e-postprogram.
E-postfilter bruker mange teknikkar for å velje ut kva e-post som skal stoppast. Det kan til dømes vere slik at e-post frå utvalde internettdomene eller til og med land vert stoppa. Mottakarsystemet kan krevje at e-post som skal godkjennast, stettar strenge krav til form og informasjon om avsendaren. E-postsystemet kan sjå etter vevlenkjer som er kjende for å vere problematiske, og dei kan sjå etter heilt spesifikke mønster i teksten som til dømes «herbal Viagra» eller «I want a man now».
Men søppelspreiarane tilpassar seg filteralgoritmane og finn stadig nye triks for å skjule at dei sender ut søppel. Til dømes legg dei falsk avsendarinformasjon i e-posten, slik at systemet ikkje oppdagar at han er send frå ein kjend søppelspreiar. Eller dei skriv meldingane på ein måte som ikkje passar med mønsteret systemet har lært seg å sjå etter så langt.
Ein viktig del av filtreringa skjer gjennom ein prosess som heiter bayesiansk søppelpostfiltrering. Denne teknikken krev at e-postbrukarar markerer e-post som søppel når han kjem inn. Det at filteret får vite om ord som er vanlege i søppel, hjelper til i utrekninga av sannsynet for at vi har med ei søppelpostmelding å gjere. Eit ord som «million» vil gjerne vere meir sannsynleg i søppelpost enn i annan e-post, og det vil auke sannsynet for at ei melding er søppel. Når og ord som «confidential», «transaction», «fund» og «account» også dukkar opp, aukar sannsynet endå meir, slik at systemet kan velje å klassifisere e-post som søppel.
Bayesianske søppelpostfilter er baserte på ein samanheng mellom sannsyn som vart formulert på 1700-talet av den britiske pastoren Thomas Bayes. Han sa at sannsynet for at noko (for eksempel ei setning p) er sant (eller usant) gjeve ein observasjon (gjerna kalla e), er proporsjonal med sannsynet for at vi observerer e når p er sann (ev. usann), multiplisert med sannsynet for at p er sann (ev. usann) i det heile teke. Dette medfører blant anna at hendingar som er uvanlege, treng ein del stadfestande observasjonar for at vi skal tru på dei. Folk flest er nok ikkje så flinke til å tenkje ut frå regelen til Bayes, men legar er nøydde til bruke dette prinsippet. Dei vil ikkje nødvendigvis stille ein sjeldan diagnose, sjølv om ein pasient har fleire av symptoma.
Baysianske system krev at nokon markerer e-post som søppel, og det er du som e-postbrukar som må gjere dette. Kvar gong du får ei søppelmelding, må du markere henne, og så tek det bayesianske filteret seg av resten. Det registrerer orda i meldinga og legg dei til i statistikken over ord som har vore med i søppelpostar.
Etter kvart vert meldingar med mange typiske søppelord automatisk avviste, og søppelspreiarane må finne nye taktikkar for å sleppe gjennom. I e-postverda går det føre seg eit evig kappløp mellom dei gode, som vil finne ut kva som er søppel, og dei vonde, som prøver stadig nye triks for å sleppe gjennom filteret med ei melding.
Slike filter vil aldri verte 100 prosent sikre, så vi som e-postbrukarar må òg syne litt kritisk sans. Ei og anna svindelmelding kjem til å komme gjennom, og då er det smart å ta seg bryet med å markere henne som søppel.
Samstundes vil det òg vere slik at meldingar du gjerne vil ha, kan ha vorte filtrerte vekk. Derfor kan det vere smart av og til å ta ein kik på meldingar som har vorte stoppa.
Ein sjeldan gong er søppelposten såpass (ufriviljug) morosam at det faktisk er kjekt å få han. Lars Nyre får innimellom høflege e-brev av typen «Dear Dr. Lars Kidney. I hope this email finds you well.»
Det automatiske omsetjingssystemet som vert brukt til å lage teksten i e-brevet, var visst ikkje så suverent, og det er ei trøyst i ein kvardag der teknologien ofte verkar feilfri og styrande.
Bjørnar Tessem og Lars Nyre
Er du abonnent? Logg på her for å lese vidare.
Digital tilgang til DAG OG TID – heilt utan binding
Prøv ein månad for kr 49.
Deretter kr 199 per månad. Stopp når du vil.
Ein dag kom dette tilbodet ramlande inn i e-postsystemet: «Dear sir/madam, I have decided to seek confidential cooperation with you for the execution of the deal described here. I have discovered an unclaimed fund totaling US $ 3.5 million that belongs to a customer who unfortunately lost his life and entire family in a car accident.»
Vidare vert vi lova ein stor del av desse pengane viss vi oppgjev ein del personleg informasjon. Men dette flotte tilbodet kom aldri inn i e-postkassa vår. Det vart stoppa av e-postfilteret som Universitetet i Bergen har sentralt.
Det skal ikkje mykje til før e-postadressa di er spreidd for alle vindar. Det er nok å kjøpe eit produkt på ein utanlandsk nettstad, så dukkar slike meldingar opp. E-postadressene til oss universitetstilsette ligg ope på vevsider og er lette å få tak i. Adressene vert samla i databasar som blir brukte til masseutsendingar av tvilsame økonomiske forslag, tilbod om seksuelle tenester og meir uskuldige tilbod som invitasjon til falske akademiske konferansar. Titusenvis av slik e-post strøymer til e-postsystemet ved universitetet kvar einaste dag.
For mange ville slik e-post ha vore eit uhandterleg problem om vi ikkje hadde hatt søppelpostfilter. Kampen mot misbruk av opne kommunikasjonskanalar har medført at alle større verksemder i dag bruker slike filter. Du kan òg byggje opp ditt eige søppelpostfilter i eit privat e-postprogram.
E-postfilter bruker mange teknikkar for å velje ut kva e-post som skal stoppast. Det kan til dømes vere slik at e-post frå utvalde internettdomene eller til og med land vert stoppa. Mottakarsystemet kan krevje at e-post som skal godkjennast, stettar strenge krav til form og informasjon om avsendaren. E-postsystemet kan sjå etter vevlenkjer som er kjende for å vere problematiske, og dei kan sjå etter heilt spesifikke mønster i teksten som til dømes «herbal Viagra» eller «I want a man now».
Men søppelspreiarane tilpassar seg filteralgoritmane og finn stadig nye triks for å skjule at dei sender ut søppel. Til dømes legg dei falsk avsendarinformasjon i e-posten, slik at systemet ikkje oppdagar at han er send frå ein kjend søppelspreiar. Eller dei skriv meldingane på ein måte som ikkje passar med mønsteret systemet har lært seg å sjå etter så langt.
Ein viktig del av filtreringa skjer gjennom ein prosess som heiter bayesiansk søppelpostfiltrering. Denne teknikken krev at e-postbrukarar markerer e-post som søppel når han kjem inn. Det at filteret får vite om ord som er vanlege i søppel, hjelper til i utrekninga av sannsynet for at vi har med ei søppelpostmelding å gjere. Eit ord som «million» vil gjerne vere meir sannsynleg i søppelpost enn i annan e-post, og det vil auke sannsynet for at ei melding er søppel. Når og ord som «confidential», «transaction», «fund» og «account» også dukkar opp, aukar sannsynet endå meir, slik at systemet kan velje å klassifisere e-post som søppel.
Bayesianske søppelpostfilter er baserte på ein samanheng mellom sannsyn som vart formulert på 1700-talet av den britiske pastoren Thomas Bayes. Han sa at sannsynet for at noko (for eksempel ei setning p) er sant (eller usant) gjeve ein observasjon (gjerna kalla e), er proporsjonal med sannsynet for at vi observerer e når p er sann (ev. usann), multiplisert med sannsynet for at p er sann (ev. usann) i det heile teke. Dette medfører blant anna at hendingar som er uvanlege, treng ein del stadfestande observasjonar for at vi skal tru på dei. Folk flest er nok ikkje så flinke til å tenkje ut frå regelen til Bayes, men legar er nøydde til bruke dette prinsippet. Dei vil ikkje nødvendigvis stille ein sjeldan diagnose, sjølv om ein pasient har fleire av symptoma.
Baysianske system krev at nokon markerer e-post som søppel, og det er du som e-postbrukar som må gjere dette. Kvar gong du får ei søppelmelding, må du markere henne, og så tek det bayesianske filteret seg av resten. Det registrerer orda i meldinga og legg dei til i statistikken over ord som har vore med i søppelpostar.
Etter kvart vert meldingar med mange typiske søppelord automatisk avviste, og søppelspreiarane må finne nye taktikkar for å sleppe gjennom. I e-postverda går det føre seg eit evig kappløp mellom dei gode, som vil finne ut kva som er søppel, og dei vonde, som prøver stadig nye triks for å sleppe gjennom filteret med ei melding.
Slike filter vil aldri verte 100 prosent sikre, så vi som e-postbrukarar må òg syne litt kritisk sans. Ei og anna svindelmelding kjem til å komme gjennom, og då er det smart å ta seg bryet med å markere henne som søppel.
Samstundes vil det òg vere slik at meldingar du gjerne vil ha, kan ha vorte filtrerte vekk. Derfor kan det vere smart av og til å ta ein kik på meldingar som har vorte stoppa.
Ein sjeldan gong er søppelposten såpass (ufriviljug) morosam at det faktisk er kjekt å få han. Lars Nyre får innimellom høflege e-brev av typen «Dear Dr. Lars Kidney. I hope this email finds you well.»
Det automatiske omsetjingssystemet som vert brukt til å lage teksten i e-brevet, var visst ikkje så suverent, og det er ei trøyst i ein kvardag der teknologien ofte verkar feilfri og styrande.
Bjørnar Tessem og Lars Nyre
Kvar gong du får ei søppelmelding, må du markere henne, og så tek det bayesianske filteret seg av resten.
Fleire artiklar
Carl Friedrich Abel (1723–1787). Utsnitt av måleri av Thomas Gainsborough frå 1777.
Mellom verder
Carl Friedrich Abel var den siste store viola da gamba-virtuosen.
Trea vil fortelje meg noko, skriv Ranveig Lovise Bungum.
Foto: Trond Mjøs
Kva ospa og dei andre trea kan fortelje oss
Anders Hovden.
Foto via Wikimedia Commons
Hovdens fredssalme
I 1923 sende Anders Hovden salmen «Joleklokker yver jordi» til bladet Under Kirkehvælv, der han kom på trykk same året.
I kvardagen kan det verte litt stress, til dømes får du ikkje den grøne pynten heilt perfekt. Men her er den herlege tomatsuppa mi med skrei.
Foto: Dagfinn Nordbø
Kvardagen
Det er dei det er flest av, kvardagane.
Teikning: May Linn Clement
Det skulle berre mangla
Det er nok ikkje manglande hjartelag som gjer at folk er interesserte i ord.