Gretel går GA med privacy engineering udvikler stak

0
191

Chris PreimesbergerSkrevet af Chris Preimesberger, bidragende forfatter Chris Preimesberger Chris Preimesberger Bidragende skribent

Chris J. Preimesberger har forsket, rapporteret og analyseret it-nyheder og -tendenser siden 1995, hvor han som redaktør af et internationalt nyhedsbrev, Sun's Hottest, udgav en artikel, der definerede en ny protokol kaldet Java.

Fuld bio den 3. februar 2022 | Emne: Software & Tjenester

San Diego-baserede Gretel er en af ​​de første virksomheder, der fokuserer på kommerciel forretningsbrug af syntetiske data. Den to år gamle startup annoncerede i denne uge den generelle tilgængelighed af sit værktøjssæt til privatlivsingeniør, der indeholder API'er og tjenester, der gør det muligt for brugere at klassificere, transformere og generere syntetiske data af høj kvalitet.

Hvis du ikke ved, hvad der består af syntetiske data, har du masser af selskab. Syntetiske data er information, der er kunstigt fremstillet af maskiner snarere end genereret af begivenheder i den virkelige verden. Syntetiske data skabes algoritmisk og bruges som stand-in for testdatasæt af produktions- eller driftsdata til at validere matematiske modeller og i stigende grad til at træne maskinlæringsmodeller (ML). Disse substituerende data hjælper med at bevare privatlivets fred i personlige oplysninger og kan spare it-systemer for en masse tid, besvær og penge i processen.

Når ML-modeller oprettes, skal dataene være rene. Hvis der er fejl, duplikationer eller andre problemer i virkelige data ved bygning af sådanne modeller, vil der uundgåeligt dukke problemer op, hvilket koster tid og penge for virksomheden. Med flere og flere kunstig intelligens og ML-modeller, der bliver brugt i forskellige use cases, vokser behovet for syntetiske data hurtigt. Analytikere har forudsagt, at mere syntetiske end originale data vil blive brugt til at bygge ML-modeller ved udgangen af ​​årtiet.

At være i stand til at klassificere, transformere og generere syntetiske data af høj kvalitet fjerner flaskehalse i privatlivets fred for adskillige udviklings- og workflowprocesser, der forhindrer datadeling og kvæler innovation, sagde CEO Ali Golshan til ZDNet.

“Vi har bygget et privatlivsværktøj, der er tilgængeligt for alle udviklere og skalerbart til ethvert virksomhedsklar projekt,” sagde Golshan. “Med Gretel kan enhver klassificere, anonymisere og syntetisere data, der er bevist for beskyttelse af personlige oplysninger og meget nøjagtige med blot et par klik. Vores avancerede privatlivsgarantier giver også brugerne fuld kontrol over at justere databeskyttelsesniveauer baseret på deres projektbehov og beskytter syntetiske data. data mod kontradiktoriske angreb.”

Golshan sagde, at virksomheden har testet sine produkter i et åbent beta-program i mere end et år. Det har inkorporeret forbedringer til sit værktøjssæt baseret på feedback fra mere end 60 virksomhedsengagementer, et fællesskab af tusindvis af brugere og open source-brugere, som ifølge virksomheden har downloadet SDK'et mere end 70.000 gange.

Gretel har arbejdet med organisationer over flere vertikale industrier, sagde Golshan, herunder sundhedspleje, biovidenskab, finans og spil. Noget af dets seneste arbejde inkluderer at skabe syntetiske genomiske data og syntetiske tidsseriebankdata.

Interessen for Gretels databeskyttelsesværktøjer understøttes af analytikernes prognoser om, at syntetiske data i 2030 fuldstændig vil overskygge reelle data i AI-modeller, sagde Golshan

“Ved at bygge fleksibel, sikker, og værktøjer, der er nemme at implementere til at understøtte datadrevne udviklere, vil Gretel åbne en verden af ​​fremskridt på tværs af industrier,” sagde Max Wessel, Executive Vice President & Chief Learning Officer hos SAP.

Avanceret privatlivsteknik gjort tilgængelig

Gretels alt-i-en privatlivsstack består af tekniske værktøjer, der:

Opretter meget nøjagtige, fortrolighedsbeviste syntetiske data

Seed præproduktionssystemer med sikre, statistisk nøjagtige datasæt

Identificer og fjern følsomme data for at reducere PII-relaterede risici

Forøg og de-bias datasæt for at træne ML/AI-modeller retfærdigt

Anonymiser følsomme data i realtid for data i stor skala

Gretel ser også en forhåndsvisning af en AWS S3-lagerforbindelse til sit værktøjssæt. For mere information, gå her. Gretels tjenester kan tilgås gennem dets SaaS cloud-udbud eller CLI til lokale miljøer.

ZDNet anbefaler

Vinter-OL 2022: Sådan ser du kampene i Beijing Deal: Snag a Logitech MX Master 3 til dens laveste pris endnu. Bedste tilbud på streamingenheder til det store spil: Roku, Fire Stick, Apple TV Bedste tv-tilbud lige nu: Sony, LG, TCL, mere De bedste bærbare kraftværker 2022 Big Data Analytics