Topprogrammeertaal voor datawetenschap: Python regeert nog steeds, gevolgd door SQL

0
122

Liam Tung

Door Liam Tung | 26 juli 2021 — 09:58 GMT (10:58 BST) | Onderwerp: Ontwikkelaar

Professionals op het gebied van datawetenschap en machine learning hebben de adoptie van de programmeertaal Python gestimuleerd, maar datawetenschap en machine learning missen nog steeds belangrijke tools in het bedrijfsleven en hebben ruimte om te groeien voordat ze essentieel worden voor de besluitvorming, aldus Anaconda, de maker van een databank. wetenschappelijke distributie van Python.

Python zou wel eens de populairste programmeertaal kunnen worden en strijden om de eerste plaats met JavaScript, Java en C, afhankelijk van naar welke taalrangschikking je kijkt. Maar terwijl de adoptie van Python enorm in opkomst is, staan ​​de velden die eraan ten grondslag liggen – datawetenschap en machine learning – nog in de kinderschoenen.

De meeste respondenten (63%) zeiden dat ze Python vaak of altijd gebruikten, terwijl 71% van de docenten zei dat ze machine learning en datawetenschap onderwijzen met Python, dat populair is geworden vanwege het gebruiksgemak en de gemakkelijke leercurve. Een indrukwekkende 88% van de studenten zei dat ze Python leerden als voorbereiding om het veld van datawetenschap/machine learning te betreden.

Gezien het publiek van Anaconda, is het niet verwonderlijk dat Python verreweg de meest gebruikte taal was. Het werd gevolgd door SQL, R, JavaScript, HTML/CSS, Java, Bash/Shell, C/C++, C·, Typescript, PHP, Rust, Julia en Go.

Meer dan een derde (37%) van de 4.299 datawetenschapsprofessionals, studenten en academici die van april tot mei reageerden op de online-enquête van Anaconda, zei dat hun organisaties hun investeringen in datawetenschap hebben verlaagd, terwijl 26% hun investeringen verhoogde en 24% zei dat de investeringen vlak waren. Het is niet duidelijk welke impact de pandemie heeft gehad op investeringen in datawetenschapstools en -technologie.

Toch zei zo'n 39% dat “veel” van hun zakelijke beslissingen afhankelijk zijn van datawetenschap, terwijl 35% zei dat slechts enkele zakelijke beslissingen waren gebaseerd op inzichten van hun team.

Een kwart van de respondenten zei dat ze niet de middelen hadden voor effectieve analyse, terwijl een ander kwart zei dat besluitvormers in hun organisatie worstelen met datageletterdheid, en 11% zei dat zij of hun team geen zakelijke impact konden aantonen .

Slechts 36% beschreef de besluitvormers van hun organisatie als “zeer datageletterd” en begreep daadwerkelijk datavisualisatie en -modellen. Iets meer dan de helft (52%) zei dat besluitvormers “voornamelijk datageletterd waren”.

Anaconda vroeg respondenten ook om alle vaardigheden te nomineren die hun organisatie volgens hen op dit moment miste. De meest ontbrekende vaardigheid was in “big data management” met 38%, terwijl 26% zei dat hun organisatie geen geavanceerde wiskunde had, en een kwart noemde “zakelijke kennis” als ontbrekend.

Andere vaak genoemde vaardigheden die schaars waren, waren deep learning (27%), communicatieve vaardigheden (22%), datavisualisatie (22%), machine learning (21%), Python (20%) en waarschijnlijkheid en statistiek (19%) .

Het grootste probleem dat volgens de meeste datawetenschapsmensen moest worden aangepakt in kunstmatige intelligentie en machine learning, was “sociale gevolgen van vooringenomenheid in gegevens en modellen” (31%), gevolgd door “gevolgen voor individuele privacy”. Beide problemen zijn benadrukt door de toepassing van AI en gezichtsherkenning in openbare bewakingssystemen. Microsoft-president Brad Smith heeft onlangs de regering opgeroepen gezichtsherkenning te reguleren vanwege raciale vooroordelen.

Andere grootste zorgen waren banenverlies door automatisering (19%), geavanceerde informatieoorlogvoering (15%) en gebrek aan diversiteit en inclusie in het beroep (10%).

Gewoon 10% van de respondenten zei dat hun organisatie een oplossing had geïmplementeerd om eerlijkheid te garanderen en vooroordelen te verminderen, maar Anaconda ontdekte dat 30% van plan was om volgend jaar een stap te implementeren.

Verklaarbaarheid en interpreteerbaarheid van ML-modellen was een ander groot hiaat. Ongeveer 31% zei dat hun organisatie geen plannen had om de uitleg en interpreteerbaarheid te garanderen, maar 41% zei dat er plannen waren om enkele stappen in de komende 12 maanden te implementeren of al een stap te zetten.

De meeste respondenten (65%) zeiden dat hun werkgevers hen aanmoedigden om bij te dragen aan open source-projecten, maar 18% van de respondenten zei dat de werkgeverssteun voor open source is afgenomen als gevolg van COVID-19 of andere factoren.

Ongeveer 41% zei dat beveiligingsbugs in open source software het belangrijkste obstakel waren dat hun organisatie verhinderde om open source software te gebruiken. Python en veel van zijn populaire datawetenschaps- en machine learning-pakketten/bibliotheken, zoals NumPy en TensorFlow, zijn open source-projecten.

Interessant is dat een kwart van de respondenten zei dat ze hun open source-pijplijn niet beveiligden, terwijl 20% niet wist welke stappen hun organisatie ondernam om ervoor te zorgen dat kwetsbaarheden worden beheerd. Anaconda biedt een enterprise-service om organisaties te helpen pakketten te blokkeren of op te nemen die voldoen aan de normen van een onderneming. Het heeft ook een beheerde bibliotheek van 7.500 open-sourcepakketten voor Python.

anaconda-meest-populaire-talen.png < p>

Anaconda

Verwante onderwerpen:

Enterprise Software Open Source mobiel besturingssysteem Liam Tung

Door Liam Tung | 26 juli 2021 — 09:58 GMT (10:58 BST) | Onderwerp: Ontwikkelaar