Hvordan bruke ChatGPT til å lage diagrammer og tabeller med avansert dataanalyse

0
43
466 Eugene Mymrin/Getty Images

Vet du hva som flyter båten min? Diagrammer og grafer.

Gi meg et kult diagram å grave i, og jeg er urimelig glad. Jeg elsker å se nyhetene på valgkvelder, ikke for stemmetellingen, men for alle de flotte listene. Jeg bytter mellom kanaler hele kvelden for å se alle mulige måter hvert nettverk finner for å presentere numeriske data. 

Er det rart? Jeg tror ikke det.

Også: Øyeblikket jeg skjønte at ChatGPT Plus var en game-changer for virksomheten min

Som det viser seg, gjør ChatGPT en god jobb med å lage diagrammer og tabeller. Og gitt at denne allestedsnærværende generative AI-chatboten kan syntetisere massevis av informasjon til noe diagramverdig, hva ChatGPT gir opp i en vakker presentasjon, mer enn veier opp for i informasjonsverdi.

Det burde ikke komme som noen overraskelse for noen at AI chatbots' funksjonssett endres hele tiden. Fra tidspunktet for denne oppdateringen (slutten av mai 2024), har OpenAI nettopp kommet ut med en Mac-applikasjon og har gitt ut sin GPT-4o LLM, som er tilgjengelig for både gratis og betalende kunder. GPT-4o-versjonen som kommer for den ekstra prisen Plus-versjonen skal ha interaktive kartfunksjoner og muligheten til å samhandle med motoren lenger per økt.

Men, ikke så mye. Min gratiskonto tilbyr ikke GPT-4o i det hele tatt ennå. Den har ikke rullet ut til alle gratiskontoer ennå. Og mens den betalte ChatGPT Plus-planen gir den interaktive diagramfunksjonen i Chrome og Safari, gjør den det ikke i Mac-appen.

Også: ChatGPT vs. ChatGPT Plus: Er et betalt abonnement fortsatt verdt det?

Denne artikkelen ble sist oppdatert da funksjonene for avansert dataanalyse (som inkluderte diagrammer) bare var tilgjengelig for Plus-kunder. Selv om noen av disse funksjonene er ment å være tilgjengelige for gratiskunder, siden min gratiskonto ikke har dem ennå, kommer jeg til å presentere resten av denne artikkelen som om kartfunksjonene bare er tilgjengelige for Plus-kunder. Hvis du er en gratis kunde og har GPT-4o, kan du gjerne prøve noen av instruksjonene. Disse funksjonene kan fungere for deg, og vil utvilsomt gjøre det når vi beveger oss fremover i tid.

Avansert dataanalyse produserer relativt stygge diagrammer. Men det rocker. La oss først diskutere hvor ChatGPT henter dataene sine, så lager vi noen tabeller.

Hvordan bruke ChatGPT til å lage diagrammer og tabeller

1. Forstå de forskjellige versjonene av ChatGPT

Tidligere har vi snakket om hvilke kartverktøy som er tilgjengelige i hvilke versjoner av ChatGPT. Men det er mer enn bare kartleggingsverktøy. Hvis du ønsker å bruke ChatGPT produktivt, må du forstå hva de ulike utgavene kan gjøre.

ChatGPT gratisversjon: Denne versjonen har historisk sett brukt GPT-3.5 stor språkmodell (LLM), som ikke er fullt så dyktig som GPT-4-versjonen. Fra mai 2024 er GPT-4o LLM også tilgjengelig for enkelte gratisbrukere og rulles ut over tid.

ChatGPT Plus:ChatGPT Plus er OpenAIs kommersielle, fulldrevne versjon av ChatGPT. Akkurat nå tilbyr ChatGPT Plus tre hovedutvalg per økt: GPT-3.5, GPT-4 og GPT-4o. Det pleide å tilby plugins, men de har blitt erstattet av tilpassede GPT-er.

GPT-4- og GPT-4o-versjonene inkluderer nå DALL-E 3, Bing-netttilgang og avansert dataanalyse. Noen brukere har rapportert problemer med å bruke Bing for nettilgang. Det meste av det vi skal gjøre er å bruke komponenten Advanced Data Analysis. Selv uten Bing-netttilgang, rapporterer GPT-4 og 4o at treningsdata nå inkluderer informasjon frem til desember 2023. 

Også: Hva står GPT for? Forstå GPT 3.5, GPT 4, GPT-4o og mer

For mye av denne artikkelen vil vi bruke Advanced Data Analysis-komponenten i GPT-4-alternativet. Dette verktøyet vil importere datatabeller i et bredt spekter av filformater. Selv om den ikke spesifiserer en størrelsesgrense for importerte data, kan den håndtere ganske store filer, men vil gå i stykker hvis filene overskrider et udefinert kompleksitetsnivå.

Etter hvert som ChatGPT Plus endres, og det vil gjøre det, vil vi oppdatere deg med mer informasjon. For nå, la oss bare se på å lage noen kule diagrammer.

ChatGPT Enterprise: Avansert dataanalyse og plugins er også tilgjengelig i bedriftsversjonen . Du kan laste opp filer til Enterprise, og de forblir konfidensielle. Enterprise skal også tillate større filer og større svar. Pris er ikke spesifisert.

2. Lag en grunnleggende tabell

La oss starte med et eksempel. For den følgende demonstrasjonen vil vi jobbe med de fem beste byene når det gjelder befolkning.

List opp de fem beste byene i verden etter befolkning. Inkluder land.

Jeg stilte dette spørsmålet til ChatGPTs gratisversjon, og her er hva jeg fikk tilbake:

basic-city-list Skjermbilde av David Gewirtz/ZDNET

Det er enkelt å gjøre disse dataene om til en tabell. Bare fortell ChatGPT at du vil ha et bord:

Lag en tabell over de fem beste byene i verden etter befolkning. Inkluder land.

basic-city-table Skjermbilde av David Gewirtz/ZDNET

3. Manipuler tabellen

Du kan manipulere og tilpasse en tabell ved å gi ChatGPT mer detaljerte instruksjoner. Igjen, ved å bruke gratisversjonen, vil vi legge til et felt for befolkningstall. Selvfølgelig er disse dataene utdaterte, men de presenteres uansett:

Lag en tabell over de fem beste byene i verden etter befolkning. Ta med land og et befolkningsfelt

by-tabell-med-befolkning Skjermbilde av David Gewirtz/ZDNET

Du kan også spesifisere visse detaljer for tabellen, som feltrekkefølge og enheter. Her flytter jeg landet først og komprimerer befolkningstallene.

Lag en tabell over de fem beste byene i verden etter befolkning. Ta med land og et befolkningsfelt. Vis feltene i rekkefølgen rangering, land, by, befolkning. Vis befolkning i millioner (med ett desimal), så 37 833 000 vil vises som 37,8 millioner.

Merk at jeg ga AI et eksempel på hvordan jeg ville at tallene skulle vises.

city-table-manipulated Skjermbilde av David Gewirtz/ZDNET

Det er omtrent så langt som gratisversjonen tar oss. Fra nå av bytter vi til $20/måned ChatGPT Plus-versjonen.

4. Lag et stolpediagram

ChatGPT Plus med Advanced Data Analytics aktivert kan lage linjediagrammer, stolpediagrammer, histogrammer, sektordiagrammer, spredningsplott, varmekart, boksplott, områdediagrammer, boblediagrammer, Gantt-diagrammer, Pareto-kart, nettverksdiagrammer, Sankey-diagrammer, choropleth-kart, radarkart, ordskyer, trekart og 3D-kart.

I dette eksemplet skal vi bare lage et enkelt stolpediagram.

Lag et stolpediagram over de fem beste byene i verden etter befolkning

Pratende lite verktøy, ikke sant?

bar-chart Skjermbilde av David Gewirtz/ZDNET

De ørneøyde blant dere har kanskje lagt merke til avviket i populasjoner mellom den forrige tabellen vist og resultatene her. Legg merke til at tabellen har et grønt ikon og denne grafen har et lilla ikon. Vi har hoppet fra GPT-3.5 (gratisversjonen av ChatGPT) til GPT-4 (i ChatGPT Plus). Det er interessant at de forskjellige LLM-ene har litt forskjellige data. Denne forskjellen er en del av hvorfor det lønner seg å være forsiktig når du bruker AI-er, så dobbeltsjekk arbeidet ditt. I vårt tilfelle demonstrerer vi bare diagrammer, men dette er et håndgripelig eksempel på hvor selvsikkert presenterte data kan være feil eller inkonsekvente.  

5. Last opp data

En av avansert dataanalyse' superkrefter er muligheten til å laste opp et datasett. For eksempelet vårt lastet jeg ned datasettet «Popular Baby Names» fra Data.gov. Dette er en kommadelt fil med babynavn i New York City fra 2011-2014. Selv om det er et tiår utdatert, er det morsomt å leke med.

Datasettet jeg valgte for denne artikkelen er lett tilgjengelig fra et offentlig nettsted, slik at du kan replikere dette eksperimentet på egen hånd. Det er massevis av flotte datasett tilgjengelig på Data.gov, men jeg fant ut at mange er altfor store for ChatGPT å bruke. 

Også: Hvordan bruke ChatGPT for å lage en app

Når jeg lastet ned denne, innså jeg at den også inkluderte informasjon om etnisitet, slik at vi kan kjøre en rekke forskjellige diagrammer fra samme datasett.

Klikk på den lille opplastingsknappen og fortell den datafilen du vil importere.

baby-name-import Skjermbilde av David Gewirtz/ZDNET

Jeg ba den vise meg de fem første linjene i filen så jeg&apos ;d vite mer om filens format.

6. Lag et sektordiagram (og endre farger)

Jeg var nysgjerrig på hvordan datasettet fordelte kjønnsnavn. Her er min første melding:

Lag et sektordiagram som viser kjønn som en prosentandel av det totale datasettet

Og her er resultatet:

p>

green-gender-pieSkjermbilde av David Gewirtz/ZDNET

Dessverre gjør den mørke nyansen av grønn tallene vanskelige å lese. Heldigvis kan du instruere Advanced Data Analytics til å bruke forskjellige farger. Jeg var nøye med å velge farger som ikke forsterket kjønnsstereotypier.

Lag et sektordiagram som viser kjønn som en prosentandel av det totale datasettet. Bruk lysegrønn for hann og middels gul for hunn.

gul-grønn-kjønnspai Skjermbilde av David Gewirtz/ZDNET

7. Normaliser data for nøyaktighet

Som vi så tidligere, inkluderer dataene som samles inn etnisitet. Slik ser du fordelingen av de ulike etnisitetene New York registrerte på begynnelsen av 2010-tallet:

Vis fordelingen av etnisitet i datasettet ved hjelp av et kakediagram. Bruk kun lyse farger.

Og her er resultatet. Merker du noe?

rå-etnisitet-diagram Skjermbilde av David Gewirtz/ZDNET

Tilsynelatende normaliserte ikke New York dataene sine på riktig måte. Den brukte “WHITE NON HISPANIC” og “HVIT IKKE HISP” sammen, "BLACK NON HISPANIC" og "SORT IKKE HISP" sammen, og "ASIAN OG PACIFIC ISLANDER" og "ASIAN AND PACI" sammen. Dette resulterte i unøyaktige representasjoner av dataene.

En fordel med ChatGPT er at den husker instruksjoner gjennom en økt. Så jeg var i stand til å gi den denne instruksjonen:

For alle følgende forespørsler, grupper “WHITE NON HISPANIC” og “HVIT IKKE HISP” sammen. Gruppe "BLACK NON HISPANIC" og "SORT IKKE HISP" sammen. Gruppen "ASIAN OG PACIFIC ISLANDER" og “ASIAN AND PACI”. Bruk det lengste av de to etnisitetsnavnene når du viser etnisitet.

Og den svarte:

gruppe-normal Skjermbilde av David Gewirtz/ZDNET

La oss prøve diagrammet på nytt ved å bruke samme ledetekst.

Vis fordelingen av etnisitet i datasettet ved hjelp av et sektordiagram. Bruk kun lyse farger.

Det er bedre:

gruppefast Skjermbilde av David Gewirtz/ZDNET

Du må være flittig når du ser på resultater. For eksempel, i en forespørsel om de beste babynavnene, skilte AI ut "Madison" og "MADISON" som to forskjellige navn:

case-sensitive-baby-names Skjermbilde av David Gewirtz/ZDNET

For alle de følgende forespørslene skal babynavn skille mellom store og små bokstaver.

8. Eksporter grafikken din

La oss avslutte med et komplekst diagram fra én ledetekst. Her er oppfordringen vår:

For hver etnisitet, presenter to kakediagrammer, ett for hvert kjønn. Hvert kakediagram skal vise de fem beste babynavnene for det kjønnet og den etnisiteten. Bruk kun lyse farger.

Som det viser seg, genererte diagrammet tekst som var for liten til å leses. Så for å få et mer nyttig diagram, kan vi eksportere det ut igjen. Jeg skal spesifisere både filformat og filbredde:

Eksporter dette diagrammet som en 3000 piksler bred JPG-fil.

eksport-bekreftelse Skjermbilde av David Gewirtz/ZDNET

Og her er resultatet:

pie-chart-extravaganza Skjermbilde av David Gewirtz/ZDNET

Merk at Sofia og Sophia er veldig populære, men vises som to forskjellige navn. Men det er det som gjør diagrammer så fascinerende.

Vanlige spørsmål

Hvor mye koster det å bruke Advanced Data Analytics?

Advanced Data Analytics kommer med ChatGPT Plus. Noen av funksjonene er tilgjengelige i GPT-4o for gratisversjonen av ChatGPT. ChatGPT Plus er $20 per måned. Advanced Data Analytics er også inkludert i Enterprise-utgaven, men prisene for det har ikke blitt utgitt ennå.

Holdes dataene som er lastet opp til ChatGPT for kartlegging private eller er det en risiko for dataeksponering?

Anta at det alltid er en personvernrisiko.

Jeg stilte dette spørsmålet til ChatGPT, og dette er hva det fortalte meg: 

< p>Personvern er en prioritet for ChatGPT. Opplastede data brukes utelukkende til formålet med brukerens nåværende økt og lagres ikke langsiktig eller brukes til andre formål. For svært sensitive data bør brukere imidlertid alltid utvise forsiktighet og vurdere å bruke Enterprise-versjonen av ChatGPT, som tilbyr forbedret datakonfidensialitet.

Også: Generativ AI medfører nye risikoer for alle. Slik kan du holde deg trygg

Min anbefaling: Ikke stol på ChatGPT eller noe generativt AI-verktøy. Enterprise-versjonen er ment å ha flere personvernkontroller, men jeg vil anbefale at du bare laster opp data som du ikke har noe imot å finne veien til offentlig synlighet.

Kan ChatGPTs avanserte dataanalyse håndtere sanntidsdata eller er den mer egnet for statiske datasett?

Det er mulig, men det er noen praktiske begrensninger. For det første vil Plus-kontoen begrense antallet forespørsler du kan gjøre i en gitt tidsperiode. For det andre må du laste opp hver fil individuelt. Det er mulighet for at du kan bruke en lisensiert ChatGPT API for å gjøre sanntidsanalyse. Men for selve chatboten ser du på parsing av data i hvile.

Du kan følge mine daglige prosjektoppdateringer på sosiale medier. Sørg for å abonnere på mitt ukentlige oppdateringsnyhetsbrev på Substack, og følg meg på Twitter på @DavidGewirtz, på Facebook på Facebook.com/DavidGewirtz, på Instagram på Instagram.com/DavidGewirtz og på YouTube på YouTube.com/DavidGewirtzTV.< /p>