Be någon reporter för att nämna en del av deras jobb de hatar verkligen och de flesta kommer att säga att det är vad jag gör just nu — transkription.
Du går till stor längder för att få den historien, men då måste man få den gyllene ord som du precis har samlats på den utskrivna sidan. Det finns bara ett sätt att göra det och det är transkription — den tråkiga uppgiften att skriva in de ord som du har arbetat så hårt för att få.
Det finns många företag som erbjuder transkription tjänster, men den centrala frågan är noggrannhet.
Nu Trint, ett företag som ägs av en mycket erfaren veteran av många utländska krig, hävdar att den har utvecklat ett sätt att få de röst-inspelade ord direkt på den utskrivna sidan korrekt. Användare som inkluderar några av de största medierna namn, såsom New York Times, ABC News, Thomson Reuters, AP, CBS och BBC Worldwide.
Ex-rapporterade vände Trint VD Jeff Kofman förklarar hur det görs.
ZDNet: Hur fick du först att få idén till Trint?
Kofman: jag kallar mig själv oavsiktlig entreprenör. Jag har spenderat mer än tre decennier som en tv-journalist — en utrikeskorrespondent, rapportering från över 40 länder.
Det var egentligen genom en olycka som jag var med att sätta ihop en global journalism-programmet och träffade några utvecklare som hade gjort intressanta arbete i spoken word avskrifter. Jag sa att jag spenderat mitt liv med att transkribera intervjuer, föredrag och konferenser men som tal-till-text hade varit att få bättre och bättre, varför kan det inte göra tunga lyft för mig? De visste inte vem denna galna reporter var, men detta intressant idé som dykt upp.

Kofman på arbetet: “Det var en av de glödlampa stunder. Vi tänkte, varför inte hade detta gjorts innan?”
Foto: Kofman
Det var en av de glödlampa stunder. Vi tänkte, varför har inte detta gjorts tidigare? Detta var runt 2013 och vi började Trint 2014. Jag önskar att jag kunde säga att jag var några stora visionära, men jag visste inte att tekniken var på detta stora ögonblick när tal-till-text var bara att få till det framåt och uppåt scenen.
Om du hade provat det här två år tidigare, skulle det ha misslyckats. Två år senare, skulle du kunna följa oss. Om du tycker om en surfare på havet letar efter en våg för att vi bara fick vågen när den bildades.
SE: att Lansera och bygga en startup: En founder ‘ s guide (gratis PDF)
Och jag tror att det hände eftersom jag har bott problemet. Om du inte bor inne i problemet då man faktiskt inte vet att det är ett problem. Jag snubblade in i det, men jag kan se att vår ursprungliga tre utvecklare var på sina grejer. De resultat som kommer tillbaka var bättre än jag hade förväntat mig.
Tanken var att vi skulle anpassa texten — maskinen-som genereras utskrift och source audio — det talade ordet och göra det exakt millisekund, så att du kan följa det som karaoke, och sedan var vi tvungna att räkna ut ett sätt att rätta till det. Det är där som det blev riktigt intressant.
Vad vi gjorde var att vi kom upp med idén om att slå samman en text-editor, som i Word, för att en audio-video player och skapa ett verktyg som hade två mycket distinkta funktioner.
Så det är där det kommer, och jag kommer ihåg att säga till dessa killar, och jag tror att de trodde att jag var lite galen — att detta är framtiden. Antingen får vi tillsammans och göra denna sak hända eller vi kommer att gå in på ett kafé i ett par år och kommer någon att kunna arbeta på vissa program som gör exakt vad vi just har tänkt.
Jag sa, jag kommer inte att låta det hända. Detta är verkligen säga att världen behöver för att göra det talade ordet kan upptäckas. Vi är en värld av video, ljud, podcasting, och YouTube. Vi behöver inte tala med skrivna bokstäver längre, genom att sms: a längre. Vi talar genom ljud-och videoinspelning. De är inte sökbara. Print gör dem sökbara.
Låt oss få en timeline här. När insåg du för första gången får idén?
Väl i början av 2014 började det att gro och vi etablerat företaget på hösten ’14 och vi började bygga. Jag var med och arrangerade samtal till vissa journalist vänner på tidningar, tv, radio, online, och jag sätter på min reporter hatt och gjorde detta med ett dussin eller flera lag runt om i världen så att ingenjörerna kunde förstå vad problemet är. Jag sade: säg mig hur gör du för att ta anteckningar, hur gör du för att hitta det innehåll de inspelningar. Och alla sa: “Omigod jag hatar att transkribera, det är den värsta delen av mitt jobb. Det är alltid samma — lyssna, sluta skriv, lyssna, sluta, typ. Om du kan ge oss en genväg till att du har utfört ett mirakel”.
Och det är vad vi gör.
När fick du upp det och köra?
Vi började bygga den 1 December 2014. Vi hade ett första proof of concept ut ganska snabbt. I februari ’15 vi gjorde något som faktiskt visade sig vara riktigt lyckad.
Det var genom den första inkubator vi var i en grupp som kallas IDEALondon, som sponsras av Cisco och UCL — och jag träffade en kvinna där och hon gick med på att göra en dag av användarens upplevelse att testa våra proof-of-concept.
Trint: redigeringsfönstret visar tydligt alternativ för att få sidan att se ut precis rätt.
Foto: Trint
Under denna provning var vi i ett rum — fyra av oss — och att hon var i en annan med sex journalister som vi hade planerat för en timme vardera och gå igenom ett antal uppgifter. Vi misslyckades. Det var som att titta på ditt barn gå upp på scenen och glömmer hennes linjer i skolan play. Och det vi såg var när vi var misslyckas och det blir ganska teknisk — vi använder begrepp som var alldeles för komplicerad för folk att förstå. Vi var tvungna att göra det enklare och lättare.
Och ut för att testa dagen — och på den tiden var företaget förmodligen tre eller fyra månader gammal— jag förstod vad vi skulle göra för att fixa detta, för att göra den användbar.
Det är där produkten av idag var född.
Det var vinter 2015 och vi förstod då vad vi behövde göra, och vi lanserats kommersiellt i September 2016.
Vi var redan testat med journalister genom sommaren 2016. På grund av min långa karriär har jag haft en hel del vänner så jag kunde säga, “Kom och prova det här”. Och det verkligen tog fart.
Sommaren 2016, bestämde vi oss för att testa det på den öppna marknaden och vi i detta skede var att skicka ut det gratis. Sedan något stort hänt. Och en journalist vän till oss twittrade om det och att vi sedan tittade på när vi gick från 50-eller 100 vi hade på denna punkt till 200, 500, 1 000, så 4.000 och allt detta hände i ett par timmar.
Och det var verkligen spännande och då blev det riktigt läskigt eftersom systemet kraschade. Det var inte byggd för att skala eftersom vi bara hade inga förväntningar på denna. Men det enda det gjorde var att validera konceptet och det visade sig att folk verkligen var så hungrig att utnyttja AI, för att transkribera.
Du vet, det system som hade kraschat, och vi fick folk att e-posta oss att säga vad har du gjort? Vi var tillbaka upp inom 36 timmar och vad som berättade det för oss var att det var verkligt intresse för vad vi gjorde.
SE: Hur man ska genomföra AI och maskininlärning (ZDNet särskild rapport) | Ladda ner rapporten som en PDF-fil (TechRepublic)
Så, då har vi bara byggt upp för att starta 2016. Och folk strömmade till oss eftersom de kunde se att det för inte särskilt mycket pengar kan du spara en stor mängd tid och få stora effektivitetsvinster.
Vid det laget var nog sex eller sju och genom “16 och” 17 produkten blev bättre, och vi gjorde en stor finansiering runda i Maj 2017 [$3,1 m] när vi bara var 10 personer, men vi är nu 41. Och vi har en global närvaro, med 36 i STORBRITANNIEN och fem i Toronto.
Från början var vi bara en produkt, men nu har vi produkter för små företag och stora företag.
Vilka var de personer som du som behövs för att ta i för att göra detta arbete?
Detta är udda sak om den här resan för mig, jag vet inget om verksamheten. När jag säger inget, det är nog oärligt. Jag har gjort detta i fyra år.
Jag berättar det här. När jag började söka pengar för att göra detta, en mycket god vän till mig, som är en CFO, mycket vänligt erbjöd sig att göra en ekonomisk plan, en mycket rå på en Excel. Jag hade aldrig rört Excel innan. Jag är en reporter, varför skulle jag någonsin titta på Excel? Han pratade mig igenom denna sak, och jag satt där och nickade bort.
Han gick bort och jag bytte nummer och det gick ‘Hash-taggen, hash-taggen” och det enda jag kunde göra var att spara den och öppna den igen. Jag ville bara krypa upp på bordet och säger att skicka mig tillbaka till Bagdad. För mig, näringslivets sida har varit en mycket brant inlärningskurva.
TIDIGARE OCH RELATERADE TÄCKNING
Verkligen, robotarna som tar våra jobb: En automatisk transkription software jämförelse
ZDNet har jämfört ett antal auto transkription tjänster med bemusing resultat.
Hur man bygger en temporär green screen studio YouTube
Lärdomar för livet, chroma key, och en liten video distribution historia kommer alla tillsammans i denna engagerande artikel om hur du kan producera grön skärm video om du har en dedikerad utrymme eller bara hörnet av ett kök.
Kinas AI-forskare undervisar ett neuralt nät för att utbilda sig
Forskare vid Kinas Sun Yat-Sen University, med hjälp från Kinesiska start SenseTime, förbättras deras egna försök att få en dator att urskilja mänskliga utgör i bilder genom att lägga till lite själv-övervakad träning.
5 sätt att utvärdera AI noggrannhet TechRepublic
Fastställa riktigheten kontrollpunkter på AI utfall hjälper till med beslutet att göra.
80% av de arbetstagare som vill lära sig AI-kompetens, men arbetsgivarna är inte att undervisa dem TechRepublic
Arbetstagare som blir allt mer bekväma med artificiell intelligens på arbetsplatsen, kräver ännu mer träning i dessa färdigheter, enligt Genpact.
Oculus’ VR tid-skevhet nattklubb spel med levande aktörer är till skillnad från allt annat jag har provat innan (CNET)
Under Presenterar en ny typ av VR erfarenhet som teleporterar dig från ditt vardagsrum till en spretande absurdist universum med levande aktörer. Kan det äntligen vara VR: s killer-app?
Relaterade Ämnen:
CXO
Digital Omvandling
Tech-Industrin
Smarta Städer
Cloud