Machine learning kan helpen erachter te komen wat gepoept op uw producten

0
133

Dit jaar honderden mensen kregen diarree van Salmonella-besmette rund, tahin, kratom, zelfs huisdier cavia ‘ s, om maar een paar te noemen. Salmonella-bacteriën normaal gesproken hangen in de ingewanden — en nu komen wetenschappers met behulp van machine learning om vast te stellen welke dierlijke darmen uitgezonden de onaangename en gevaarlijke bacteriën.

Onderzoekers, onder leiding van Xiangyu Deng aan de Universiteit van Georgia opgeleid een algoritme te herkennen genetische verschillen tussen Salmonella stammen gepoept door vier gemeenschappelijke hosts: varkens, koeien, pluimvee en wilde vogels. Wanneer het team het algoritme getest op Salmonella genoom van acht uitbraken van de afgelopen 20 jaar, het correct geïdentificeerd met de dierlijke bronnen voor zeven van hen, volgens een studie is vandaag online gepubliceerd in het tijdschrift Emerging Infectious Diseases. Het algoritme moet nog meer trainen, maar het is een begin in de richting van het leren waar Salmonella-infecties komen uit, en het inperken van de voedselvergiftiging of voedselinfectie.

“Dit is een extra riek.”

Er zijn ongeveer 1,2 miljoen Salmonella-infecties per jaar in de VS die de oorzaak zijn van diarree, koorts, krampen, en het doden van ongeveer 450 mensen per jaar. Het is meestal verspreid via kak, en besmette dieren vaak nog niet zindelijk. Ze kan krijgen die kak overal: op hun vacht, veren, beddengoed, voedsel, noem maar op. Zo kunnen mensen contract Salmonella door het aanraken van een besmet dier, en dan raken hun mond, of door het eten van voedsel dat besmet door geïnfecteerde dieren poepen.

Als Salmonella wordt in rundvlees, zou je verwachten dat de infectie is afkomstig van een koe. Maar Salmonella kan ook opduiken op onverwachte plaatsen, zoals in de tahin, of op cantaloupes, of zelfs drugs zoals cannabis en kratom. In die gevallen kan het moeilijk zijn te identificeren van de verderfelijke aars: vee, reptielen, knaagdieren en honden kunnen alle verspreid Salmonella, samen met andere, minder vaak voorkomende dieren. En weten waar de Salmonella komt is de sleutel tot het terugdringen van de besmetting te voorkomen of het op de eerste plaats.

Dat is de reden waarom Deng ‘ s werk kan een belangrijk vooraf. Het is nog vroeg, en het algoritme nodig heeft om te leren hoe om te identificeren van andere bronnen van Salmonella naast de vier er werd getraind op. Het kan ook erkennen alleen de bronnen van een enkel type van Salmonella — en er zijn meer dan 2.500. Maar het is een ander wapen in de publieke gezondheid arsenaal, zegt Nikki Shariat, een professor aan het Gettysburg College, die gespecialiseerd is in Salmonella, die was niet betrokken in het onderzoek. Uitbraak onderzoeken zijn afhankelijk van de epidemiologie en de interviews die bepalen wat de mensen aten en wanneer. “Dit is een extra uitsteeksel om dat”, zegt ze. En het kan helpen het proces te versnellen.

“Nu heb je deze echt verbazingwekkend bewijs.”

Bill Marler, een advocaat die gespecialiseerd is op het gebied van voedselveiligheid, zegt een tool die helpt bij het opsporen van de bron van voedselgerelateerde uitbraken, zou kunnen profiteren van de beleidsmakers. “Nu heb je deze echt verbazingwekkend bewijs door middel van whole genome sequencing dat dit spul kwam uit deze plaats,” zegt hij. “Dan echt de vraag is, wat kan je doen vanuit een voedselveiligheid perspectief, of een regelgevende perspectief, het probleem op te lossen?”

Voor het maken van de tool, Deng en zijn team gebruik van machine learning voor het identificeren van de genetische eigenschappen die hen kan helpen onderscheiden Salmonella die lekt uit verschillende dierlijke bronnen. De theorie is dat wanneer een bepaalde Salmonella stam stelt kamp in een bepaalde host als, laten we zeggen, een varken, zijn genoom verandert een beetje. En Deng ‘ s team vermoed dat ze als ze een algoritme te sorteren door middel van genoeg genomen, het programma kan leren hoe herken je de genetische vingerafdruk van de Salmonella-dat van een varken, en onderscheiden van die van de Salmonella in een koe pat.

Er zijn veel verschillende soorten Salmonella, maar het team gericht op een van de meest voorkomende hier in de VS, genoemd Salmonella Typhimurium. Ze opgespoord meer dan 1400 Salmonella Typhimurium genoom sequenties uit de hele wereld. Sommige, ze doorgeschoven zelf. Anderen, gevonden in de publieke gezondheid databases online. De collectie opgenomen monsters die bekend waren om te komen van gemeenschappelijke bronnen zoals varkens, koeien, pluimvee en wilde vogels — die de onderzoekers gebruikt om de opleiding van hun algoritme.

“Een beetje van de informatie is beter dan geen informatie.”

Het team testte hun algoritme tegen monsters uit acht uitbraken die de openbare gezondheid onderzoekers had teruggevoerd naar hun dierlijke bronnen. En gewoon door te kijken naar het genoom, het programma nauwkeurig toegeschreven zeven van de acht uitbraken naar hun dierlijke bronnen. Het was vooral goed in het identificeren van gevogelte en varkens bronnen. Onderzoekers in de genetische sequentie van een Salmonella monster gekoppeld aan een turkije pot pie uitbraak, en het programma ruzie weer uit de juiste ID: pluimvee. Wanneer het team analyseerde de evolutie van de Salmonella stammen gekoppeld aan vee, zagen ze een interessant patroon: die stammen alleen doemen op over de jaren 1990, en verspreidde zich snel over de VS. “We vermoeden dat de geïndustrialiseerde veeteelt een belangrijke rol kunnen spelen in de verspreiding en distributie,” zegt Deng.

Het identificeren van de bronnen van historische uitbraken en het bijhouden van de verspreiding van bepaalde stammen is één ding; de identificatie van de onbekende bron is van een menselijke Salmonella-infectie is een andere. En niet alle Salmonella-uitbraken komen van de soorten die het algoritme werd opgeleid aan. Wanneer het team het algoritme getest op monsters die afkomstig waren van mensen, het was er in geslaagd om een koe, varken, pluimvee of wilde vogels als de bron voor ongeveer een derde van hen. De rest was dubbelzinnig. Dat zou kunnen betekenen dat de Salmonella stam besmetten die mensen was een generalist spanning die de voorkeur geeft om te circuleren tussen meerdere host-soorten. “Ze is net van de ene naar de verschillende hosts en er is geen manier voor ons om te voorspellen welke bron ze komen,” zegt Deng. Nu, de tool niet werkt voor hen.

De dubbelzinnige Id ‘ s kan ook gewoon betekenen dat de soort afkomstig van een dier dat het algoritme was niet opgeleid op, als een vis, of een schildpad. Dat betekent dat het algoritme moet nog meer genomen om te leren van, Deng zegt. “Als we meer volgorde van het genoom ik ben er zeker van dat het aantal zal omhoog gaan”, zegt hij. Zoals het nu is, het algoritme is een proof of concept. “Een beetje van de informatie is beter dan geen informatie,” zegt hij. “Er is nog een lange weg te gaan.”