To see the other types of publications on this topic, follow the link: Djupinlärning.

Dissertations / Theses on the topic 'Djupinlärning'

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the top 50 dissertations / theses for your research on the topic 'Djupinlärning.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.

1

Finnson, Anton, and Victor Molnö. "Djupinlärning på Snake." Thesis, KTH, Skolan för teknikvetenskap (SCI), 2019. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-255828.

Full text
Abstract:
Algoritmer baserade på reinforcement learning har framgångsrikt tillämpats på många olika maskininlärningsproblem. I denna rapport presenterar vi hur vi implementerar varianter på deep Q-learning-algoritmer på det klassiska datorspelet Snake. Vi ämnar undersöka hur en sådan algoritm ska konfigureras för att lära sig spela Snake så bra som möjligt. För att göra detta studerar vi hur inlärningen beror på ett urval av parametrar, genom att variera dessa en och en och studera resultaten. Utifrån detta lyckas vi konstruera en algoritm som lär sig spela spelet så pass bra att den som högst får 66 poäng, vilket motsvarar att täcka 46 % av spelplanen, efter drygt fem timmars träning. Vidare så finner vi att den tränade algoritmen utan större svårigheter hanterar att hinder introduceras i spelet.
Reinforcement learning algorithms have proven to be successful at various machine learning tasks. In this paper we implement versions of deep Q-learning on the classic video game Snake. We aim to find out how this algorithm should be configured in order for it to learn to play the game as well as possible. To do this, we study how the learning performance of the algorithm depends on some of the many parameters involved, by changing one parameter at a time and recording the effects. From this we are able to set up an algorithm that learns to play the game well enough to achieve a high score of 66 points, corresponding to filling up 46\% of the playing field, after just above 5 hours of training. Further, we find that the trained algorithm can cope well with an obstacle being added to the game.
APA, Harvard, Vancouver, ISO, and other styles
2

Blomqvist, Linus. "Djupinlärning för kameraövervakning." Thesis, Mittuniversitetet, Institutionen för informationssystem och –teknologi, 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:miun:diva-40717.

Full text
Abstract:
Allt fler misshandelsbrott sker i Sverige enligt Brå. För att reducera detta kan det som fångats på övervakningskameror användas i brottsutredningar, för att senare användas som bevismaterial till att döma den eller de skyldiga till brottet. Genom att optimera övervakningen kan företag använda sig av automatiserad igenkänning. Automatisering för igenkänningen av normala kontra onormala beteenden går att lösa med djupinlärning. Syftet med denna undersökning är att finna en lämplig modell som kan identifiera det onormala beteendet (till exempel ett slagsmål). Modell arkitekturen som användes under projektet var 3D ResNet, eftersom den klara av en djupare arkitektur. Ett djupare nätverk, innebär bättre prediktion av problemet. 3DResNet-34 var den modell arkitekturen som gav högst noggrannhet med 93,33%. Implementering av projektet utfördes i ramverket PyTorch. Undersökningen har visat att med           hjälp av överförd inlärning går det att återanvända kunskap från förtränade modeller och applicera dessa kunskaper på det aktuella problemet. Detta bidrar till en mer pålitligare modell med noggrann prediktion på nytt övervaknings           material.
According to Brå, more assault crimes are taking place in Sweden. To reduce this, information that was captured on surveillance cameras can be used in criminal investigations, to convict the perpetrator or perpetrators of the crime. To optimize monitoring, companies can use automation. Automation of the recognition of normal versus abnormal activities can be solved with deep learning. The purpose of this study is to find a suitable model that can identify               the abnormal activity (for example, a fight). The model architecture used during the project was 3D ResNet, because it was capable of handling deeper architectures. Having a deeper network means better prediction of the problem.           3D ResNet-34 was the model architecture that gave the highest accuracy with 93,33%. Implementation of the project was carried out in the framework of PyTorch. The study has shown that with the help of transfer learning it is possible to transfer knowledge from pre-trained models and apply this          knowledge to the current problem. This contributes to a more reliable model with accurate prediction for new surveillance footage.
APA, Harvard, Vancouver, ISO, and other styles
3

Bylund, Yoana, and Eva Jacobsson. "Yt- eller djupinlärning, förstår eleverna No-undervisningen?" Thesis, Linköping University, Department of Educational Science (IUV), 1999. http://urn.kb.se/resolve?urn=urn:nbn:se:liu:diva-603.

Full text
Abstract:

Följande frågor ligger till grund för vårt arbete: - Har eleverna förstått No-undervisningen på det sätt läraren undervisat? - Vilka metoder är bättre än andra för att eleverna ska tillgodogöra sig undervisningen? Vi har dels gjort en litteraturgenomgång dels en enkätstudie för att få svar på frågorna. Vi har kommit fram till att majoriteten av eleverna har förstått lärarens undervisning och att laborationer i kombination med diskussioner har gett bra resultat.

APA, Harvard, Vancouver, ISO, and other styles
4

Almlöf, Mattias. "Stockidentifiering och estimering av diameterfördelning med djupinlärning." Thesis, Linköpings universitet, Medie- och Informationsteknik, 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:liu:diva-168461.

Full text
Abstract:
Mabema har en produkt som mäter vedvolym av virkestravar på lastbilar. Systemet är byggt på att en bildbehandlingsalgoritm hittar silhuetterna av stockarna på renderade bilder av lastbilstravar. Arbetsgivaren är inte helt nöjd med prestandan av algoritmen och vill utreda om djupinlärning kan förbättra resultatet. Detta arbete undersöker hur diameterfördelningen i varje trave kan estimeras med hjälp av djupinlärning och objektdetektering i synnerhet. Två metoder granskas, den ena hanterar problemet abstrakt med djup regression medan den andra metoden går in i detalj och nyttjar objektigenkänning för att hitta stockändar. Arbetet utvärderar även möjliheterna att träna dessa modeller baserat på data från fysiska simulationer. Det visar sig vara användbart att nyttja syntetisk data för träning och med transfer learning lyckas de syntetiska modellen uppnå kraven Biometria ställer på automatiserad diameterberäkning. Med objektdetektering visar det sig också gå att uppnå samma prestanda som arbetsgivarens algoritm med en bättre stocksökning tre gånger så snabbt eller snabbare.
APA, Harvard, Vancouver, ISO, and other styles
5

Ågren, Adam, and Dennis Åkerström. "Djupinlärning på sinogram för bildrekonstruktion från spektral CT." Thesis, KTH, Skolan för teknikvetenskap (SCI), 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-297530.

Full text
Abstract:
I takt med den nya utvecklingen av fotonräknande datortomografi med möjligheter till lägre stråldoser kommer även krav på bättre metoder för brusreducering och bildrekonstruktion. För att lösa detta problem föreslås appliceringen av ett neuralt nätverk för att filtrera bort brus och rekonstruera bilderna. Detta kan göras både före och efter övergången från sinogramdomänen till bilddomänen. Denna rapport undersöker tillämpningen av ett sådant neuralt nätverk i sinogramdomänen med fokus på hur hyperparametrarna ska bestämmas för att uppnå optimala resultat. Datamängden som tränades på bestod av basmaterialsuppdelade sinogram i form av datorsimulerade Shepp-Logan-fantomer. Hyperparametrarna som undersöktes var batchstorlek, epoker, förlustfunktion och antal faltningslager.
APA, Harvard, Vancouver, ISO, and other styles
6

Falkstål, Linus. "Den realistiska problematikern : -En systematisk litteraturstudie om entreprenöriellt förhållningssätt, problemlösning i matematik och djupinlärning i matematik i grundskolan." Thesis, Linnéuniversitetet, Institutionen för matematik (MA), 2018. http://urn.kb.se/resolve?urn=urn:nbn:se:lnu:diva-69975.

Full text
Abstract:
Det här är en systematisk litteraturstudie som belyser förhållandet mellan de tre begreppen entreprenöriellt förhållningssätt, problemlösning i matematik och djupinlärning i matematik. Resultatet består av två metaanalyser som behandlar begreppens likheter och skillnader men också dess samband till olika teoretiska utgångspunkter. Resultatet visar att det finns starka samband mellan vissa entreprenöriella förmågor och problemlösning i matematik. Dock kan det finnas ett behov av att införa vissa entreprenöriella aspekter, som ansvar, engagemang och komplexitet, i undervisning i syfte att hjälpa eleverna att uppnå en djupinlärning i matematik. Resultatet visar också att undervisningsproblem ofta uppstår genom en sambandsbrist mellan lärare och elev. Resultatet analyseras och diskuteras utifrån perspektivet att världen snabbt förändras och innehåller en allt större komplexitet vilket leder till ett behov av att förbereda eleverna matematiskt inför denna allt mer komplexa värld.
APA, Harvard, Vancouver, ISO, and other styles
7

Jonsson, Ewerbring Marcus. "Explainable Deep Learning Methods for Market Surveillance." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-300156.

Full text
Abstract:
Deep learning methods have the ability to accurately predict and interpret what data represents. However, the decision making of a deep learning model is not comprehensible for humans. This is a problem for sectors like market surveillance which needs clarity in the decision making of the used algorithms. This thesis aimed to investigate how a deep learning model can be constructed to make the decision making of the model humanly comprehensible, and to investigate the potential impact on classification performance. A literature study was performed and publicly available explanation methods were collected. The explanation methods LIME, SHAP, model distillation and SHAP TreeExplainer were implemented and evaluated on a ResNet trained on three different time-series datasets. A decision tree was used as the student model for model distillation, where it was trained with both soft and hard labels. A survey was conducted to evaluate if the explanation method could increase comprehensibility. The results were that all methods could improve comprehensibility for people with experience in machine learning. However, none of the methods could provide full comprehensibility and clarity of the decision making. The model distillation reduced the performance compared to the ResNet model and did not improve the performance of the student model.
Djupinlärningsmetoder har egenskapen att förutspå och tolka betydelsen av data. Däremot så är djupinlärningsmetoders beslut inte förståeliga för människor. Det är ett problem för sektorer som marknadsövervakning som behöver klarhet i beslutsprocessen för använda algoritmer. Målet för den här uppsatsen är att undersöka hur en djupinlärningsmodell kan bli konstruerad för att göra den begriplig för en människa, och att undersöka eventuella påverkan av klassificeringsprestandan. En litteraturstudie genomfördes och publikt tillgängliga förklaringsmetoder samlades. Förklaringsmetoderna LIME, SHAP, modelldestillering och SHAP TreeExplainer blev implementerade och utvärderade med en ResNet modell tränad med tre olika dataset. Ett beslutsträd användes som studentmodell för modelldestillering och den blev tränad på båda mjuka och hårda etiketter. En undersökning genomfördes för att utvärdera om förklaringsmodellerna kan förbättra förståelsen av modellens beslut. Resultatet var att alla metoder kan förbättra förståelsen för personer med förkunskaper inom maskininlärning. Däremot så kunde ingen av metoderna ge full förståelse och insyn på hur beslutsprocessen fungerade. Modelldestilleringen minskade prestandan jämfört med ResNet modellen och förbättrade inte prestandan för studentmodellen.
APA, Harvard, Vancouver, ISO, and other styles
8

Hägg, Kristian, and Sara Wallander. "Elevers upplevelser av alternativa prov." Thesis, Malmö högskola, Lärarutbildningen (LUT), 2008. http://urn.kb.se/resolve?urn=urn:nbn:se:mau:diva-33109.

Full text
Abstract:
Detta är en avhandling om hur elever i en årskurs sex får en större erfarenhet av alternativa prov i jämförelse med traditionella prov i avseende på deras lärande. De fick tre olika prov varav ett var ett traditionellt skriftligt prov, som främst testade deras minneskunskap. De andra två proven var alternativa prov. Eleverna fick sedan besvara en del frågor om hur de upplevde dessa två olika former av prov. Resultatet var blandat, en del elever föredrog det alternativa provet, en del inte. De flesta eleverna trodde dock att de lärde sig mer från de alternativa proven eftersom frågorna var mer öppna och att de då fick möjlighet att tänka ut svaren i ett större sammanhang.
This is an essay about how students in sixth class possess any experience about alternative test in comparison to a traditional assessment considering their learning. During this examination the students received three different examples; the first one was a traditional written test, which mainly tests their memory knowledge. The other two tests were alternative tests. The students had to answer some questions concerning their experience about these two different kinds of tests. The results we got from the study were divergent. Some of the students liked it and some didn’t. But most of the students thought that they learned more from the alternative tests, because the questions in this test were more open, and because of that they had some opportunity to think about the answers in a larger context.
APA, Harvard, Vancouver, ISO, and other styles
9

Alkmark, Niklas. "Praktisk matematik ur ett lärarperspektiv." Thesis, Växjö University, School of Education, 2006. http://urn.kb.se/resolve?urn=urn:nbn:se:vxu:diva-947.

Full text
Abstract:

Abstract: I rapporten intervjuas fyra mellanstadielärare på en 4-6 skola i Borås stad, om deras syn på praktisk matematik. I vilken utsträckning använder sig lärarna av praktisk matematik, när använder dom det, hur ser de på själva uppgiften samt om uppgifterna ökar elevernas motivation, lust och förståelse för matematik.

Intervjuerna deklarerar att det finns en stor osäkerhet i hur praktisk matematik skall användas och vilka fördelar den för med sig. Lärarna anser att det bedrivs för lite praktisk matematik på skolan, bokens trygghet lockar allt för mycket. Lärarna poängterar också att vissa områden är lättare än andra att applicera praktisk matematik på. Det finns inte någon direkt uttalad linje när det gäller praktiska moment utan det kommer när det kommer. Däremot är man överens om att lusten och motivationen ofta stärks och att de svaga eleverna får möjlighet att lyckas. Vissa forskare menar att ett praktiskt arbetssätt är helt nödvändigt för att ta upp kunskapen på en ny nivå. Kunskapen måste kunna sättas in i en kontext för att djupinlärning skall erhållas.

APA, Harvard, Vancouver, ISO, and other styles
10

Lennholm, Helena. "Att undervisa med olika lärstilar : En fallstudie från den pedagogiska praktiken." Thesis, Växjö University, School of Education, 2006. http://urn.kb.se/resolve?urn=urn:nbn:se:vxu:diva-441.

Full text
Abstract:

Syftet med denna undersökning var att ta reda på hur en grupp elevers lärande påverkades genom användning av olika lärstilar som renodlats. Detta genomfördes som en fallstudie i vilken jag ställde mig frågorna:

Vilka olika lärstilar har mina elever?

Hur kan undervisningen utformas så att olika lärstilar renodlas?

Hur påverkas elevernas lärande av undervisning där olika lärstilar har renodlats?

Fallstudien bestod av flera olika kvalitativa metoder. Först lät jag eleverna utföra ett par lärstilstest för att få en uppfattning om vilka lärstilar som fanns representerade i gruppen. Jag utgick från teorier om sinnespreferenser och multipla intelligenser. Nästa del av fallstudien var att utveckla en lektionsplanering där jag renodlade vissa lärstilar. Här utgick jag från alla inspirationskällor jag hittade, litteratur, kollegor, eleverna osv. Jag utgick också från resultaten av lärstilstesten. Under lektionerna skrev eleverna och jag ner våra reflektioner i loggböcker.

Sista delen av studien var att ta reda på hur elevernas lärande påverkats av undervisningen där olika lärstilar hade renodlats. För detta gjordes en skriftlig utvärdering.

Vi fick reda på en hel del om vilka olika lärstilar eleverna har. Jag har lärt mig mycket mer om hur jag kan utforma min undervisning så att jag renodlar vissa lärstilar. Elevernas lärande påverkades synnerligen gynnsamt av undervisning där olika lärstilar renodlades. Jag har fått indikationer på att några av eleverna upplevde att de lärde sig mer djupinriktat. Deras motivation och lust ökade. De kreativa inslagen i undervisningen uppskattades mycket; musik, lek och skrivande, men framförallt variationen av undervisningssätt.

APA, Harvard, Vancouver, ISO, and other styles
11

With, Lena. "18,21, Piruett : En kvalitativ studie där pedagogers och elevers uppfattningar om dansmatteundervisning synliggörs." Thesis, Mälardalens högskola, Akademin för utbildning, kultur och kommunikation, 2014. http://urn.kb.se/resolve?urn=urn:nbn:se:mdh:diva-25292.

Full text
Abstract:
Syftet med studien är att undersöka och synliggöra faktorer som kan påverka  dansmatteundervisnings relevans för elevers lärande i matematikämnet, detta i grundskolans tidigare år. Två kvalitativa insamlingsmetoder, i form av semistrukturerade intervjuer och observationer, har använts i undersökningen. Resultatet antyder att dansmatteundervisning kan vara relevant i och med att arbetssättet innebär en förståelseinriktad undervisning, där ett reflekterande arbetssätt med gemensamma samtal om matematiskt innehåll genomsyrar undervisningen. Att kommunikationen ökar, genom att både verbal och kinestetisk kommunikation samspelar i dansmatteundervisning, kan också bidra till att arbetssättet kan vara relevant. Pedagogens möjlighet till direkt återkoppling till elever anses som en styrka i dansmatteundervisning. De mest kritiska och avgörande faktorerna som kan påverka eller begränsa dansmatteundervisnings relevans antyder resultaten vara pedagogens ämnesspecifika kompetens, genomförande av samplanering mellan involverade pedagoger, samt tidsplaneringen med mängden avsatt tid för genomförandet av dansmatteundervisning. Dessa faktorer kan påverka eller begränsa dansmatteundervisnings relevans för elevers lärande. Slutsatser som gjorts i studien är att dansmatteundervisning är relevant för elevers lärande i matematikämnet ur aspekter som elevers möjlighet till djupinlärning, ökad kommunikation i undervisningen, ökad konceptuell undervisning, förståelseinriktad undervisning samt att elever upplever variationen som motivationshöjande. Dansmatteundervisning kan både vara inkluderande och exkluderande för elever, vilket påverkar dansmatteundervisningens relevans.
APA, Harvard, Vancouver, ISO, and other styles
12

Nilsson, Henrik. "Evaluation of Methods for Person Re-identification between Non-overlapping Surveillance Cameras." Thesis, Linköpings universitet, Medie- och Informationsteknik, 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:liu:diva-177889.

Full text
Abstract:
This thesis describes a comparison of several state-of-the-art methods used for re-identification of a person between several non-overlapping views captured by surveillance cameras. Since 2014, the focus of the area of person re-identification has been heavily oriented towards approaches employing the use of neural network due to the increase in performance shown from this approach. Three different methods employing convolutional neural networks as a means of attempting automatic person re-identification have mainly been evaluated in this thesis. These three methods are named Spatial-Temporal Person Re-identification (ST-reID), Top DropBlock Network (Top-DB-Net), and Adaptive L2 Regularization. A fourth method known as Multiple Expert Brainstorming Network (MEB-Net) using domain adaptation is used for comparison to the results of applying the trained models from the other three methods on an unseen environment. As an attempt at improving the results of applying the models on an unseen environment, two different approaches have been taken. The first of these is an attempt at segmenting the person from the background by creating a mask that encapsulates the person while disregarding the background, as opposed to using a rectangular cropped image for training and evaluating the methods. To do this, Mask-RCNN which is a framework for object instance segmentation is used. The second approach explored in this thesis is attempting automatic white balancing as a means of removing the effect of the illumination source of the scenes before the person images are extracted. Both approaches show positive results when the model is applied on an unseen environment as opposed to using the unchanged person images, although the results have not been able to match those that have been obtained using domain adaptation.

Examensarbetet är utfört vid Institutionen för teknik och naturvetenskap (ITN) vid Tekniska fakulteten, Linköpings universitet

APA, Harvard, Vancouver, ISO, and other styles
13

Nordlund, Birgitta. "Rida i harmoni : en studie om hur ryttare lyckas praktisera sin teori." Thesis, Högskolan i Gävle, Akademin för utbildning och ekonomi, 2010. http://urn.kb.se/resolve?urn=urn:nbn:se:hig:diva-7817.

Full text
Abstract:
 Nordlund B (2010) Rida i harmoni. En studie om hur ryttare lyckas praktisera sin teori. C-uppsats i pedagogik. Högskolan i Gävle.   Uppsatsens syfte är att undersöka hur ryttaren tänker när den letar harmoni i sin ridning. Genom en kvalitativ studie fick informanterna förklara sina teoretiska kunskaper om vad harmoni är och hur det upplevs. Sedan fick de beskriva hur de tänker när de letar efter harmoni i ridningen. Med detta som grund försökte jag sedan att tolka de faktorer som såg ut att påverka dem när de letade efter harmonin i ridningen.   Jag hoppades också att studien skulle ge vägledning om hur ridundervisningen kan utvecklas så att lärandet i ridning underlättas.   Uppsatsen grundar sig på en kvalitativ studie med sex ryttare som går på gymnasiet och där har ridning på schemat.   Studien påvisade att ryttarna förstod teorin och de som hade den praktiska kunskapsnivån kunde hitta harmoni i ridningen om de fick handledning. Utan handledning hade de svårare att hitta dit. Min bild av informanterna är att de har svårt att se sin ridning i ett större sammanhang. Det jobbar här och nu och försöker lösa eventuella problem med ett relativt kortsiktligt tänkande. Ryttarna förstod dock vad de gjorde och varför. Detta utan att värdera hur rätt eller fel de utförde det som de trodde att de gjorde.
APA, Harvard, Vancouver, ISO, and other styles
14

Mirzai, Badi. "Physics-Informed Deep Learning for System Identification of Autonomous Underwater Vehicles : A Lagrangian Neural Network Approach." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-301626.

Full text
Abstract:
In this thesis, we explore Lagrangian Neural Networks (LNNs) for system identification of Autonomous Underwater Vehicles (AUVs) with 6 degrees of freedom. One of the main challenges of AUVs is that they have limited wireless communication and navigation under water. AUVs operate under strict and uncertain conditions, where they need to be able to navigate and perform tasks in unknown ocean environments with limited and noisy sensor data. A crucial requirement for localization and adaptive control of AUVs is having an accurate and reliable model of the system’s nonlinear dynamics while taking into account the dynamic environment of the ocean. Most of these dynamics models do not incorporate data. The collection of data for AUVs is difficult, but necessary in order to have more flexibility in the model’s parameters due to the dynamic environment of the ocean. Yet, traditional system identification methods are still dominant today, despite the recent breakthroughs in Deep Learning. Therefore, in this thesis, we aim for a data-driven approach that embeds laws from physics in order to learn the state-space model of an AUV. More precisely, exploring the LNN framework for higher-dimensional systems. Furthermore, we also extend the LNN to account for non-conservative forces acting upon the system, such as damping and control inputs. The networks are trained to learn from simulated data of a second-order ordinary differential equation of an AUV. The trained model is evaluated by integrating paths from different initial states and comparing them to the true dynamics. The results yielded a model capable of predicting the output acceleration of the state space model but struggled in learning the direction of the forward movement with time.
I den här uppsatsen utforskas Lagrangianska Neurala Nätverk (LNN) för systemidentifiering av Autonoma Undervattensfordon (AUV) med 6 frihetsgrader. En av de största utmaningarna med AUV är deras begränsningar när det kommer till trådlös kommunikation och navigering under vatten. Ett krav för att ha fungerande AUV är deras förmåga att navigera och utföra uppdrag under okända undervattensförhållanden med begränsad och brusig sensordata. Dessutom är ett kritiskt krav för lokalisering och adaptiv reglerteknik att ha noggranna modeller av systemets olinjära dynamik, samtidigt som den dynamiska miljön i havet tas i beaktande. De flesta sådana modeller tar inte i beaktande sensordata för att reglera dess parameterar. Insamling av sådan data för AUVer är besvärligt, men nödvändigt för att skapa större flexibilitet hos modellens parametrar. Trots de senaste genombrotten inom djupinlärning är traditionella metoder av systemidentifiering dominanta än idag för AUV. Det är av dessa anledningar som vi i denna uppsats strävar efter en datadriven metod, där vi förankrar lagar från fysik under inlärningen av systemets state-space modell. Mer specifikt utforskar vi LNN för ett system med högre dimension. Vidare expanderar vi även LNN till att även ta ickekonservativa krafter som verkar på systemet i beaktande, såsom dämpning och styrsignaler. Nätverket tränas att lära sig från simulerad data från en andra ordningens differentialekvation som beskriver en AUV. Den tränade modellen utvärderas genom att iterativt integrera fram dess rörelse från olika initialstillstånd, vilket jämförs med den korrekta modellen. Resultaten visade en modell som till viss del var kapabel till att förutspå korrekt acceleration, med begränsad framgång i att lära sig korrekt rörelseriktning framåt i tiden.
APA, Harvard, Vancouver, ISO, and other styles
15

Westerberg, Jacob. "A deep learning approach for action classification in American football video sequences." Thesis, Uppsala universitet, Avdelningen för systemteknik, 2017. http://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-333663.

Full text
Abstract:
The artificial intelligence is a constant topic of conversation with a field of research that is pushed forward by some of the world's largest companies and universities. Deep learning is a branch of machine learning within artificial intelligence based on learning representation of data such as images and texts by processing the data through deep neural networks. Sports are competitive businesses that over the years have become more data driven. Statistics play a big role in the development of the practitioners and the tactics in order to win. Sport organizations have big statistic teams since statistics are manually obtained by these teams. To learn a machine to recognize patterns and actions with deep learning would save a lot of time. In this thesis a deep learning approach is used to examine how well it can perform to classify the actions pass and run in American footbal lgames. A deep learning architecture is first trained and developed on a public video dataset and then trained to classify run and pass plays on a new American football dataset called the All-22 dataset. Results and earlier research show that deep learning has potential to automatize sport statistic but is not yet ready to overtake the role statistic teams have. Further research, bigger and more task specific datasets and more complex architectures are required to enhance the performance of this specific type of deep learning based video recognition.
APA, Harvard, Vancouver, ISO, and other styles
16

Fleron, Emil. "Automatic Classification of text regarding Child Sexual Abusive Material." Thesis, Uppsala universitet, Avdelningen för systemteknik, 2018. http://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-357290.

Full text
Abstract:
Sexual abuse is a horrible reality for many children around the world. As technology improves the availability of encryption schemes and anonymity over the internet, the perpetrators of these acts are increasingly hard to track. There have been several advances in recent time to automate the work of trying to catch these perpetrators and especially image recognition has seen great promise. While image recognition is a natural approach to these subjects as many abuses are documented and shared between perpetrators, there are potentially many leads that go unexplored if only focusing on images and videos. This study evaluates how methods of supervised machine learning solely based on textual data can point us to posts on forums which are connected to the distribution of child sexual abusive material. Feature representation techniques such as word-vectors, paragraphvectors and the FastText algorithm were used in conjunction with supervised machine learning methods based on deep learning, including methods of multilayer perceptrons, convolutional neural networks and long-short term memory models. The models were trained and evaluated on a dataset based on forum posts from a Dark Net leak from last year, and are evaluated as well on text collected from websites that had been manually verified by Ecpat. Those models were compared to a baseline model based on logistic regression. It was found that those state-of-the-art models achieve a similar performance, all outperforming the 'benchmark' logistic regression model. Further improvements can be achieved based on the availability of more annotated data.
APA, Harvard, Vancouver, ISO, and other styles
17

Arousell, Anna. "Segmenting Mitochondria from Lattice Light-sheet data in 3D using Deep Learning." Thesis, KTH, Skolan för kemi, bioteknologi och hälsa (CBH), 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-301278.

Full text
Abstract:
This thesis project evaluates and compares different deep learning based segmentation tools for acquiring 3D segmentations of mitochondria. These segmentations could then hopefully be used in the future to quantify the mitochondria dynamics, which is vital for the survival of human cells. Four different models were evaluated and compared using the metrices Intersection over Union (IoU) and Dice, and a measurement of the quantity and area of the segmented mitochondria. The four different models were from the Fiji U-Net plugin, MitoSegNet, EmbedSeg 2D and EmbedSeg 3D. The data used was microscopic images of transfected MDCKII cells taken using a Lattice light-sheet microscope. Processing of the data was done in Fiji, which included manual annotation of the images in order to acquire ground truth segmentations. The results showed that the most suited model for this task was the model from the Fiji U-Net plugin. The other models also generated adequate segmentations, but could not adapt to images from a different cell. It was also concluded that stacking together 2D segmentations in order to achieve a 3D segmentations was successful.
Detta examensarbete utvärderar och jämför olika djupinlärningsbaserade segmenteringsverktyg för att få 3D-segmenteringar av mitokondrier. Dessa segmenteringar kan sedan förhoppningsvis användas i framtiden för att kvantifiera mitokondriernas dynamik, vilken är avgörande för de mänskliga cellernas överlevnad. Fyra olika modeller utvärderades och jämfördes med hjälp av måtten IoU och Dice, samt en mätning av kvantiteten och arean av de segmenterade mitokondrierna. De fyra olika modellerna var från en Fiji U-Net-plugin, MitoSegNet, EmbedSeg 2D och EmbedSeg 3D. Datan som användes var mikroskopbilder av transfekterade MDCKII-celler tagna med ett Lattice light-sheet mikroskop. Processeringen av datan gjordes i Fiji, som inkluderade manuell annotering av bilderna för att få ground truth segmenteringar. Resultaten visade att modellen som var bäst lämpad för denna uppgift var modellen från Fiji U-Net-pluginen. De andra modellerna genererade också adekvata segmenteringar, men kunde inte anpassa sig till bilder av en annan cell. En slutsats var också att stapla samman 2D-segmenteringar för att få 3D-segmenteringar var en lyckad metod.
APA, Harvard, Vancouver, ISO, and other styles
18

Haapanen, Rollenhagen Svante. "Automatic Music Recommendation for Businesses : Using a two-stage Membership model for track recommendation." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-303007.

Full text
Abstract:
This thesis proposes a two-stage recommendation system for providing music recommendations based on seed playlists as inputs. The goal is to help businesses find relevant and brand-fit music to play in their venues. The problem of recommending music using machine learning has been investigated quite a bit in both academia and the industry, with collaborative filtering and content-based filtering being the major approaches used. One of the difficulties of creating a recommendation system is how to evaluate it. In this thesis, both a quantitative and a qualitative evaluation are made to determine how well the results correspond to the actual quality of recommendations. The application of recommending music to businesses also poses different problems than a service directed at end consumers, mostly related to how many track recommendations are needed. A two-stage approach was used with Stage 1 producing candidates and a Stage 2 model using a neural network comparing five tracks from the playlist with a candidate was used to rank said candidates. The results show that the Stage 2 model has substantially better results in both the qualitative and quantitative evaluation compared to Stage 1. The quality of the recommendations from the whole system is not completely satisfactory, and some possible reasons for this are discussed, including improving the Stage 1 candidate generator (which was not modified in the scope of this thesis).
Automatisk musikrekommendation med hjälp av maskininlärning har utforskats av både industrin och akademin genom åren, där två huvudsakliga metoder utkristalliserats: collaborative filtering samt content-based filtering. I det här arbetet har en content-based modell tagits fram, uppdelad i två stadier: Steg 1 som genererar kandidater som Steg 2 sedan ordnade om med hjälp av ett neuralt nätverk som jämförde 5 låtar i taget från en spellista med motsvarande kandidater genererade av Steg 1 En av svårigheterna med att skapa automatiska rekommendationer är utvärderingen av den. I det här arbetet har både en kvantitativ och kvalitativ studie utförts för att försäkra att resultaten motsvarar den faktiska kvaliten hos rekommendationerna. Slutmålet med att hjälpa företag med musikrekommendation ställer också unika problem att lösa i jämförelse med en tjänst för privatpersoner, framförallt relaterat till storleken på de returnerade rekommendationerna. Resultaten visade att Steg 2 lyckades rangordna rekommendationerna från Steg 1 på ett sätt som gav högre poäng i både den kvantitativa och kvalitativa utvärderingen av systemen. De slutgiltiga resultaten var inte helt tillfredsställande, och potentialla orsaker till detta diskuteras. Dessa inkluderar Steg 1 (som inte modifierades inom ramen för detta arbete). Utvärderingen visade dock att de kvantitativa utvärderingsramarna verkar motsvara den upplevda kvaliten hos rekommendationerna baserat på den kvalitativa utvärderingen.
APA, Harvard, Vancouver, ISO, and other styles
19

Karlsson, Mikael. "Identifying New Fault Types Using Transformer Embeddings." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-303009.

Full text
Abstract:
Continuous integration/delivery and deployment consist of many automated tests, some of which may fail leading to faulty software. Similar faults may occur in different stages of the software production lifecycle and it is necessary to identify similar faults and cluster them into fault types in order to minimize troubleshooting time. Pretrained transformer based language models have been proven to achieve state of the art results in many natural language processing tasks like measuring semantic textual similarity. This thesis aims to investigate whether it is possible to cluster and identify new fault types by using a transformer based model to create context aware vector representations of fault records, which consists of numerical data and logs with domain specific technical terms. The clusters created were compared against the clusters created by an existing system, where log files are grouped by manual specified filters. Relying on already existing fault types with associated log data, this thesis shows that it is possible to finetune a transformer based model for a classification task in order to improve the quality of text embeddings. The embeddings are clustered by using density based and hierarchical clustering algorithms with cosine distance. The results show that it is possible to cluster log data and get comparable results to the existing manual system, where the cluster similarity was assessed with V-measure and Adjusted Rand Index.
Kontinuerlig integration består automatiserade tester där det finns risk för att några misslyckas vilket kan leda till felaktig programvara. Liknande fel kan uppstå under olika faser av en programvarans livscykel och det är viktigt att identifiera och gruppera olika feltyper för att optimera felsökningsprocessen. Det har bevisats att språkmodeller baserade på transformatorarkitekturen kan uppnå höga resultat i många uppgifter inom språkteknologi, inklusive att mäta semantisk likhet mellan två texter. Detta arbete undersöker om det är möjligt att gruppera och identifiera nya feltyper genom att använda en transformatorbaserad språkmodell för att skapa numeriska vektorer av loggtext, som består av domänspecifika tekniska termer och numerisk data. Klustren jämförs mot redan existerande grupperingar som skapats av ett befintligt system där feltyper identifieras med manuellt skrivna filter. Det här arbetet visar att det går att förbättra vektorrepresenationerna skapade av en språkmodell baserad på transformatorarkitekturen genom att tilläggsträna modellen för en klassificeringsuppgift. Vektorerna grupperas med hjälp av densitetsbaserade och hierarkiska klusteralgoritmer. Resultaten visar att det är möjligt att skapa vektorer av logg-texter med hjälp av en transformatorbaserad språkmodell och få jämförbara resultat som ett befintligt manuellt system, när klustren evaluerades med V-måttet och Adjusted Rand Index.
APA, Harvard, Vancouver, ISO, and other styles
20

Lindespång, Victor. "Bildklassificering av bilar med hjälp av deep learning." Thesis, Örebro universitet, Institutionen för naturvetenskap och teknik, 2017. http://urn.kb.se/resolve?urn=urn:nbn:se:oru:diva-58361.

Full text
Abstract:
Den här rapporten beskriver hur en bildklassificerare skapades med förmågan att via en given bild på en bil avgöra vilken bilmodell bilen är av. Klassificeringsmodellen utvecklades med hjälp av bilder som företaget CAB sparat i samband med försäkringsärenden som behandlats via deras nuvarande produkter. Inledningsvis i rapporten så beskrivs teori för maskininlärning och djupinlärning på engrundläggande nivå för att leda in läsaren på ämnesområdet som rör rapporten, och fortsätter sedan med problemspecifika metoder som var till nytta för det aktuella problemet. Rapporten tar upp metoder för hur datan bearbetats i förväg, hur träningsprocessen gick  till med de valda verktygen samt diskussion kring resultatet och vad som påverkade det – med kommentarer om vad som kan göras i framtiden för att förbättra slutprodukten.
This report describes how an image classifier was created with the ability to identify car makeand model from a given picture of a car. The classifier was developed using pictures that the company CAB had saved from insurance errands that was managed through their current products. First of all the report begins with a brief theoretical introduction to machine learning and deep learning to guide the reader in to the subject of the report, and then continues with problemspecific methods that were of good use for the project. The report brings up methods for how the data was processed before training took place, how the training process went with the chosen tools for this project and also discussion about the result and what effected it – with comments about what can be done in the future to improve the end product.
APA, Harvard, Vancouver, ISO, and other styles
21

Tornert, Susanne. "Lärarlett eller elevaktivt? : En studie av sex lektioner i ickelinjära funktioner på gymnasiet." Thesis, Stockholms universitet, Institutionen för pedagogik och didaktik, 2011. http://urn.kb.se/resolve?urn=urn:nbn:se:su:diva-58903.

Full text
Abstract:
Matematiklärare brukar ofta ha en förkärlek för katederundervisning. John Hattie (2009) har gjort en metastudie över 800 andra metastudier om vilka faktorer som påverkar elevers studieprestationer, och han menar att direktundervisning ger bättre resultat än exempelvis elevaktiva arbetssätt. Men är direktundervisning och katederundervisning samma sak? Enligt Hattie är det inte riktigt samma sak. Det framgår dock inte riktigt vilken typ av elevprestationer som egentligen mätts i de undersökningar som Hattie studerat. Men det man kan utläsa ur litteraturen är att direktundervisning framför allt är tidseffektiv. Den leder emellertid oftast till ytinlärning. Tidseffektiviteten kan förklara matematiklärarnas preferens av just katederundervisning.  Matematikkurserna är ofta innehållsmässigt omfattande och kognitivt svåra för elever att lära sig. Tidsaspekten har därför stor betydelse. För att se om katederundervisning, eller direktundervisning, är bättre för svenska elever på gymnasiet idag än vad elevaktiva arbetssätt är har sex grupper studerats. Tre av dessa har fått undervisning i form av katederundervisning (eller i en form av direktundervisning), och tre av dem har undervisats på ett elevaktivt sätt. Innehållet för lektionerna har varit ickelinjära funktioner i Matematik B. Därefter har resultaten av lektionerna analyserats utifrån vilken typ av kunskap som eleverna visat upp med avseende på yt- och djupkunskap. Ansatsen är fenomenografisk, men analysen är till stor del kvantitativ eftersom inga intervjuer gjorts med eleverna. Resultatet visar att elevaktiva arbetssätt är att föredra både när det gäller yt- och djupinlärning, Eleverna tyckte också bättre om den formen, vilket leder till ökad motivation för lärande. Direktundervisning, så som det definieras i Hattie, kan också ge bra resultat, särskilt vad gäller ytkunskaper, om alla stegen som Adams och Engelmann definierat följs.
APA, Harvard, Vancouver, ISO, and other styles
22

Kim, Max. "Improving Knee Cartilage Segmentation using Deep Learning-based Super-Resolution Methods." Thesis, KTH, Medicinteknik och hälsosystem, 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-297900.

Full text
Abstract:
Segmentation of the knee cartilage is an important step for surgery planning and manufacturing patient-specific prostheses. What has been a promising technology in recent years is deep learning-based super-resolution methods that are composed of feed-forward models which have been successfully applied on natural and medical images. This thesis aims to test the feasibility to super-resolve thick slice 2D sequence acquisitions and acquire sufficient segmentation accuracy of the articular cartilage in the knee. The investigated approaches are single- and multi-contrast super-resolution, where the contrasts are either based on the 2D sequence, 3D sequence, or both. The deep learning models investigated are based on predicting the residual image between the high- and low-resolution image pairs, finding the hidden latent features connecting the image pairs, and approximating the end-to-end non-linear mapping between the low- and high-resolution image pairs. The results showed a slight improvement in segmentation accuracy with regards to the baseline bilinear interpolation for the single-contrast super-resolution, however, no notable improvements in segmentation accuracy were observed for the multi-contrast case. Although the multi-contrast approach did not result in any notable improvements, there are still unexplored areas not covered in this work that are promising and could potentially be covered as future work.
Segmentering av knäbrosket är ett viktigt steg för planering inför operationer och tillverkning av patientspecifika proteser. Idag segmenterar man knäbrosk med hjälp av MR-bilder tagna med en 3D-sekvens som både tidskrävande och rörelsekänsligt, vilket kan vara obehagligt för patienten. I samband med 3D-bildtagningar brukar även thick slice 2D-sekvenser tas för diagnostiska skäl, däremot är de inte anpassade för segmentering på grund av för tjocka skivor. På senare tid har djupinlärningsbaserade superupplösningsmetoder uppbyggda av så kallade feed-forwardmodeller visat sig vara väldigt framgångsrikt när det applicerats på verkliga- och medicinska bilder. Syftet med den här rapporten är att testa hur väl superupplösta thick slice 2D-sekvensbildtagningar fungerar för segmentering av ledbrosket i knät. De undersökta tillvägagångssätten är superupplösning av enkel- och flerkontrastbilder, där kontrasten är antingen baserade på 2D-sekvensen, 3D-sekvensen eller både och. Resultaten påvisar en liten förbättring av segmenteringnoggrannhet vid segmentering av enkelkontrastbilderna över baslinjen linjär interpolering. Däremot var det inte någon märkvärdig förbättring i superupplösning av flerkontrastbilderna. Även om superupplösning av flerkontrastmetoden inte gav någon märkbar förbättring segmenteringsresultaten så finns det fortfarande outforskade områden som inte tagits upp i det här arbetet som potentiellt skulle kunna utforskas i framtida arbeten.
APA, Harvard, Vancouver, ISO, and other styles
23

Björklund, Filip, and Niklas Landin. "Board and Chip Diversity in Deep Learning Side-Channel Attacks : On ATtiny85 Implementations Featuring Encryption and Communication." Thesis, KTH, Skolan för industriell teknik och management (ITM), 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-300766.

Full text
Abstract:
Hardware security is an increasingly relevant topic because more and more systems and products are equipped with embedded microcontrollers. One type of threat against hardware security is attacks against encryption implementations in embedded hardware. The purpose of such attacks might be to extract the secret encryption key used to encrypt secret information that is being processed in the hardware. One type of such an attack that has gained more attention lately is side-channel attacks using deep learning algorithms. These attacks exploit the information that leaks from a chip in the form of the power the chip is consuming during encryption. In order to execute a side-channel attack assisted by deep learning, large amounts of data are needed for the neural network to train on. The data typically consists of several hundreds of thousands of power traces that have been captured from the profiling device. When the network has finished training, only a few power traces are required from a similar device to extract the key byte that has been used during encryption. In this project, the 8-bit microcontroller ATtiny85 was used as the victim device. AES-ECB 128 was used as the encryption algorithm. The goal of the project was to test how differences between boards and ATtiny85 chips affect the performance of side-channel attacks with deep learning. In the experiments, six different boards were used, where three of them had identical designs, and three of the boards had different designs. The data gathering was performed by measuring power consumption with an oscilloscope connected to a PC. The results showed that the similarity between the boards that were used for profiling and the boards that were attacked was the most important aspect for the attack to succeed with as few power traces as possible. If the board that was attacked was represented as a part of the training dataset, improved attack performance could be observed. If the training used data from several identical boards, no obvious improvement in attack performance could be seen. The results also showed that there are noticeable differences between identical ATtiny85 chips. These differences were obvious because the best attacks were the ones where the attacked chip was part of the training data set. There are several directions for future work, including how feasible these attacks are in real life scenarios and how to create efficient countermeasures.
Hårdvarusäkerhet blir mer aktuellt allt eftersom fler och fler system och produkter utrustas med mikrokontrollers. En typ av hot mot hårdvarusäkerhet är attacker mot krypteringsimplementationer i inbyggd hårdvara. Sådana attacker kan ha som syfte att försöka ta fram den krypteringsnyckel som används för att kryptera hemlig information som hanteras i hårdvaran. En sådan typ av attack, som undersökts mycket under senare år, är sidokanalsattacker där djupinlärningsalgoritmer används. Dessa attacker utnyttjar den information som läcker från ett chip genom den ström som chippet förbrukar. För att kunna utföra en sidokanalsattack med hjälp av djupinlärning krävs stora mängder data för att träna det neurala nätverket som utgör djupinlärningen. Datan består vanligtvis av flera hundra tusen strömförbrukningsspår tagna från chippet som är tänkt att attackeras. Denna data märks upp med vilken nyckel och text som använts vid krypteringen, eftersom metoden som används är övervakad inlärning. När nätverket är färdigtränat krävs bara ett fåtal strömförbrukningsspår från ett liknande chip för att ta reda på vilken nyckel som används i krypteringen. I detta projekt användes ATtiny85, en 8-bitars mikrokontroller, som det utsatta chippet för attacken. 128 bitars AES-ECB användes som krypteringsalgoritm. Målet med projektet var att testa hur olikheter mellan olika kretskort och olika identiska ATtiny85-chip påverkar resultaten av sidokanalsattacker med djupinlärning. I testerna användes sex olika kretskort, där tre stycken var likadana varandra, och tre stycken var olika varandra. Datainsamlingen skedde genom att mäta strömförbrukningen med ett oscilloskop kopplat till en dator. Resultaten visade att likheten mellan de kretskort som användes för att samla in data och kretskortet som attackeras är den viktigaste faktorn för att attacken ska lyckas med hjälp av så få insamlade strömförbrukningsspår som möjligt. Om det kretskort som attackeras är representerat som en del av träningsdatamängden ses också förbättrade effekter i attackresultaten. Om träningen sker på flera identiska kretskort kunde ingen tydlig förbättring av attackerna observeras. Resultaten visade också att det finns skillnader mellan olika identiska ATtiny85-chip. Dessa skillnader visar sig i att en attack lyckas bäst om det attackerade chippet ingick i träningsdatamängden. Framtida studier kan bland annat undersöka hur effektiva dessa attacker är i en realistisk miljö samt om det är möjligt att skapa effektiva motåtgärder.
APA, Harvard, Vancouver, ISO, and other styles
24

Diaz, Boada Juan Sebastian. "Polypharmacy Side Effect Prediction with Graph Convolutional Neural Network based on Heterogeneous Structural and Biological Data." Thesis, KTH, Numerisk analys, NA, 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-288537.

Full text
Abstract:
The prediction of polypharmacy side effects is crucial to reduce the mortality and morbidity of patients suffering from complex diseases. However, its experimental prediction is unfeasible due to the many possible drug combinations, leaving in silico tools as the most promising way of addressing this problem. This thesis improves the performance and robustness of a state-of-the-art graph convolutional network designed to predict polypharmacy side effects, by feeding it with complexity properties of the drug-protein network. The modifications also involve the creation of a direct pipeline to reproduce the results and test it with different datasets.
För att minska dödligheten och sjukligheten hos patienter som lider av komplexa sjukdomar är det avgörande att kunna förutsäga biverkningar från polyfarmaci. Att experimentellt förutsäga biverkningarna är dock ogenomförbart på grund av det stora antalet möjliga läkemedelskombinationer, vilket lämnar in silico-verktyg som det mest lovande sättet att lösa detta problem. Detta arbete förbättrar prestandan och robustheten av ett av det senaste grafiska faltningsnätverken som är utformat för att förutsäga biverkningar från polyfarmaci, genom att mata det med läkemedel-protein-nätverkets komplexitetsegenskaper. Ändringarna involverar också skapandet av en direkt pipeline för att återge resultaten och testa den med olika dataset.
APA, Harvard, Vancouver, ISO, and other styles
25

Söderqvist, Filip. "Emotion Detection from Electroencephalography Data with Machine Learning : Classification of emotions elicited by auditory stimuli from music on self-collected data sets." Thesis, KTH, Skolan för kemi, bioteknologi och hälsa (CBH), 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-296703.

Full text
Abstract:
The recent advances in deep learning have made it state-of-the-art for many different tasks, making its potential usefulness for analyzing electroencephalography (EEG) data appealing. This study aims at automatic feature extraction and classification of likeability, valence, and arousal elicited by auditory stimuli from music by training deep neural networks (DNNs) on  minimally pre-processed multivariate EEG time series. Two data sets were collected, the first containing 840 samples from 21 subjects, the second containing 400 samples from a single subject. Each sample consists of a 30 second EEG stream which was recorded during music playback. Each subject in the multiple subject data set was played 40 different songs from 8 categories, after which they were asked to self-label their opinion of the song and the emotional response it elicited. Different pre- processing and data augmentation methods were tested on the data before it was fed to the DNNs. Three different network architectures were implemented and tested, including a one-dimensional translation of ResNet18, InceptionTime, and a novel architecture built upon from InceptionTime, dubbed EEGNet. The classification tasks were posed both as a binary and a three-class classification problem. The results from the DNNs were compared to three different methods of handcrafted feature extraction. The handcrafted features were used to train LightGBM models, which were used as a baseline. The experiments showed that the DNNs struggled to extract relevant features to discriminate between the different targets, as the results were close to random guessing. The experiments with the baseline models showed generalizability indications in the data, as all 36 experiments performed better than random guessing. The best results were a classification accuracy of 64 % and an AUC of 0.638 for valence on the multiple subject data set. The background study discovered many flaws and unclarities in the published work on the topic. Therefore, future work should not rely too much on these papers and explore other network architectures that can extract the relevant features to classify likeability and emotion from EEG data.
Djupinlärning har visat sig vara effektivt för många olika uppgifter, vilket gör det möjligt att det även kan användas för att analysera data från elektroencefalografi (EEG). Målet med denna studie är att genom två egeninsamlade dataset försöka klassificera huruvida någon gillar en låt eller inte samt vilka känslor låten väcker genom att träna djupa neurala nätverk (DNN) på minimalt pre-processade EEG-tidsserier.  För det första datasettet samlades 840 dataexempel in från 21 deltagare. Dessa fick lyssna på 30-sekunders snuttar av 40 olika låtar från 8 kategorier varvid de fick svara på frågor angående vad de tyckte om låten samt vilka känslor den väckte. Det andra datasettet samlade in 400 dataexempel från endast en deltagare. Datan blev behandlad med flera olika metoder för att öka antalet träningsexempel innan det blev visat för de neurala nätverken. Tre olika nätverksarkitekturer implementerades och testades; en endimensionell variant av ResNet18, InceptionTime samt en egenbyggd arkitektur som byggde vidare på InceptionTime, döpt till EEGNet. Nätverken tränades både för binär och tre-klass klassificering.  Resultaten från nätverken jämfördes med tre olika metoder för att bygga egna prediktorer från EEG-datan. Dessa prediktorer användes för att träna LightGBM modeller, vars resultat användes som baslinje. Experimenten visade att DNNsen hade svårt att extrahera relevanta prediktorer för att kunna diskriminera mellan de olika klasserna, då resultaten var nära till godtyckligt gissande. Experimenten med LightGBM modellerna och de handgjorda prediktorerna visade dock indikationer på att det finns relevant information i datan för att kunna prediktera ett visst utfall, då alla 36 experiment presterade bättre än godyckligt gissande. Det bästa resultatet var 64 % träffsäkerhet för valens och binär klassificering, med en AUC på 0.638, för datasettet med många deltagare. Bakgrundsstudien upptäckte många oklarheter och fel i flera av de artiklar som är publicerade på ämnet. Framtida arbete bör därför inte förlita sig på denna alltför mycket. Den bör fokusera på att utveckla arkitekturer som klarar att extrahera de relevanta prediktorer som behövs för att kunna prediktera huruvida någon tycker om en låt eller inte samt vilka känslor denna väckte.
APA, Harvard, Vancouver, ISO, and other styles
26

Melcherson, Tim. "Image Augmentation to Create Lower Quality Images for Training a YOLOv4 Object Detection Model." Thesis, Uppsala universitet, Signaler och system, 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-429146.

Full text
Abstract:
Research in the Arctic is of ever growing importance, and modern technology is used in news ways to map and understand this very complex region and how it is effected by climate change. Here, animals and vegetation are tightly coupled with their environment in a fragile ecosystem, and when the environment undergo rapid changes it risks damaging these ecosystems severely.  Understanding what kind of data that has potential to be used in artificial intelligence, can be of importance as many research stations have data archives from decades of work in the Arctic. In this thesis, a YOLOv4 object detection model has been trained on two classes of images to investigate the performance impacts of disturbances in the training data set. An expanded data set was created by augmenting the initial data to contain various disturbances. A model was successfully trained on the augmented data set and a correlation between worse performance and presence of noise was detected, but changes in saturation and altered colour levels seemed to have less impact than expected. Reducing noise in gathered data is seemingly of greater importance than enhancing images with lacking colour levels. Further investigations with a larger and more thoroughly processed data set is required to gain a clearer picture of the impact of the various disturbances.
APA, Harvard, Vancouver, ISO, and other styles
27

Westermark, Hanna. "Deep Learning with Importance Sampling for Brain Tumor MR Segmentation." Thesis, KTH, Optimeringslära och systemteori, 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-289574.

Full text
Abstract:
Segmentation of magnetic resonance images is an important part of planning radiotherapy treat-ments for patients with brain tumours but due to the number of images contained within a scan and the level of detail required, manual segmentation is a time consuming task. Convolutional neural networks have been proposed as tools for automated segmentation and shown promising results. However, the data sets used for training these deep learning models are often imbalanced and contain data that does not contribute to the performance of the model. By carefully selecting which data to train on, there is potential to both speed up the training and increase the network’s ability to detect tumours. This thesis implements the method of importance sampling for training a convolutional neural network for patch-based segmentation of three dimensional multimodal magnetic resonance images of the brain and compares it with the standard way of sampling in terms of network performance and training time. Training is done for two different patch sizes. Features of the most frequently sampled volumes are also analysed. Importance sampling is found to speed up training in terms of number of epochs and also yield models with improved performance. Analysis of the sampling trends indicate that when patches are large, small tumours are somewhat frequently trained on, however more investigation is needed to confirm what features may influence the sampling frequency of a patch.
Segmentering av magnetröntgenbilder är en viktig del i planeringen av strålbehandling av patienter med hjärntumörer. Det höga antalet bilder och den nödvändiga precisionsnivån gör dock manuellsegmentering till en tidskrävande uppgift. Faltningsnätverk har därför föreslagits som ett verktyg förautomatiserad segmentering och visat lovande resultat. Datamängderna som används för att träna dessa djupinlärningsmodeller är ofta obalanserade och innehåller data som inte bidrar till modellensprestanda. Det finns därför potential att både skynda på träningen och förbättra nätverkets förmåga att segmentera tumörer genom att noggrant välja vilken data som används för träning. Denna uppsats implementerar importance sampling för att träna ett faltningsnätverk för patch-baserad segmentering av tredimensionella multimodala magnetröntgenbilder av hjärnan. Modellensträningstid och prestanda jämförs mot ett nätverk tränat med standardmetoden. Detta görs förtvå olika storlekar på patches. Egenskaperna hos de mest valda volymerna analyseras också. Importance sampling uppvisar en snabbare träningsprocess med avseende på antal epoker och resulterar också i modeller med högre prestanda. Analys av de oftast valda volymerna indikerar att under träning med stora patches förekommer små tumörer i en något högre utsträckning. Vidareundersökningar är dock nödvändiga för att bekräfta vilka aspekter som påverkar hur ofta en volym används.
APA, Harvard, Vancouver, ISO, and other styles
28

Ghandeharioon, Cosar. "An evaluation of deep neural network approaches for traffic speed prediction." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2018. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-254911.

Full text
Abstract:
The transportation industry has a significant effect on the sustainability and development of a society. Learning traffic patterns, and predicting the traffic parameters such as flow or speed for a specific spatiotemporal point is beneficial for transportation systems. For instance, intelligent transportation systems (ITS) can use forecasted results to improve services such as driver assistance systems. Furthermore, the prediction can facilitate urban planning by making management decisions data driven. There are several prediction models for time series regression on traffic data to predict the average speed for different forecasting horizons. In this thesis work, we evaluated Long Short-Term Memory (LSTM), one of the recurrent neural network models and Neural decomposition (ND), a neural network that performs Fourier-like decomposition. The results were compared with the ARIMA model. The persistent model was chosen as a baseline for the evaluation task. We proposed two new criteria in addition to RMSE and r2, to evaluate models for forecasting highly variable velocity changes. The dataset was gathered from highway traffic sensors around the E4 in Stockholm, taken from the “Motorway Control System” (MCS) operated by Trafikverket. Our experiments show that none of the models could predict the highly variable velocity changes at the exact times they happen. The reason was that the adjacent local area had no indications of sudden changes in the average speed of vehicles passing the selected sensor. We also conclude that traditional ML metrics of RMSE and r2 could be augmented with domain specific measures.
Transportbranschen har en betydande inverkan på samhällets hållbarhet och utveckling. Att lära sig trafikmönster och förutsäga trafikparametrar som flöde eller hastighet för en specifik spatio-temporal punkt är fördelaktigt för transportsystem. Intelligenta transportsystem (ITS) kan till exempel använda prognostiserade resultat för att förbättra tjänster som förarassistanssystem. Vidare kan förutsägelsen underlätta stadsplanering genom att göra ledningsbeslut datadrivna. Det finns flera förutsägelsemodeller för tidsserieregression på trafikdata för att förutsäga medelhastigheten för olika prognoshorisonter. I det här avhandlingsarbetet utvärderade vi Långtidsminne (LSTM), en av de återkommande neurala nätverksmodellerna och Neural dekomposition (ND), ett neuralt nätverk som utför Fourierliknande sönderdelning. Resultaten jämfördes med ARIMA-modellen. Den ihållande modellen valdes som utgångspunkt för utvärderingsuppgiften. Vi föreslog två nya kriterier utöver RMSE och r2, för att utvärdera modeller för prognoser av högt variabla hastighetsändringar. Datasetet insamlades från trafiksensor på motorvägar runt E4 i Stockholm, för det så kallade motorvägskontrollsystemet (MCS). Våra experiment visar att ingen av modellerna kan förutsäga de höga variabla hastighetsförändringarna vid exakta tider som de händer. Anledningen var att det intilliggande lokala området inte hade några indikationer på plötsliga förändringar i medelhastigheten hos fordon som passerade den valda sensorn. Vi drar också slutsatsen att traditionella ML-metrics av RMSE och R2 kan kompletteras med domänspecifika åtgärder.
APA, Harvard, Vancouver, ISO, and other styles
29

Rönnqvist, Mats, and Magnus Johansson. "Artificiell Intelligens inom medicinsk bilddiagnostik : En allmän litteraturstudie." Thesis, Luleå tekniska universitet, Institutionen för hälsovetenskap, 2019. http://urn.kb.se/resolve?urn=urn:nbn:se:ltu:diva-72969.

Full text
Abstract:
Bakgrund: Artificiell Intelligens (AI) kommer in i vårt samhälle och våra hem i allt större utsträckning. Inom sjukvården och radiologin kan AI utgöra ett hjälpmedel för både radiologer och röntgensjuksköterskor i deras profession. Forskning om AI fortsätter med oförminskad kraft för att finna allt bättre och mer funktionsdugliga algoritmer som kan anta den utmaningen. Syfte: Syftet med denna litteraturstudie är att sammanställa vid vilka modaliteter AI används som stöd. Metod: Studien utfördes som en allmän litteraturstudie vilket genererade femton artiklar som kvalitetsgranskades och kategoriserades efter analys. Resultat: Beroende på tidpunkt när artiklarna var skrivna varierade metoderna hur träning av AI genomfördes. Det varierade även hur bilderna skulle förbearbetats inför träning. Bilderna måste genomgå brusreducering och segmentering för att AI ska kunna klassificera den sjukliga förändringen. Den processen underlättades i senare versioner av AI där alla dessa moment utfördes på en och samma gång. Slutsats: Stora förändringar kommer att ske inom radiologin och förändringarna kommer sannolikt att påverka alla på en röntgenavdelning. Författarna kan se att utvecklingen bara börjat och forskningen måste fortgå många år framöver.
Background: Artificial Intelligence (AI) increasingly comes in to our society and homes. In the field of medical care and radiology, AI will provide an aid for radiologists and radiographers in their professions. Research on AI continues in finding better and more functional algorithms which can achieve that. Purpose: The purpose of this literature study is to compile facts about modalities using artificial intelligence as support. Method: The study was conducted as a general literature study, which generated fifteen articles that were quality-reviewed and categorized after analysis. Result: Depending on the date when the articles were written the methods varied concerning how training of AI was performed. It also varied how the images were pre-processed before training. The images need to be processed by noise reduction and segmentation for AI in order to be able to classify the pathological change. That process was facilitated in later versions of AI where all these steps were performed at the same time. Conclusion: Major changes may occur in radiology and the changes are likely to affect everyone in an X-ray ward. The authors can see that the development has just begun and research has to continue for many years to come.
APA, Harvard, Vancouver, ISO, and other styles
30

Rystedt, Beata. "Breast Cancer Risk Localization in Mammography Images using Deep Learning." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-279577.

Full text
Abstract:
Breast cancer is the most common form of cancer among women, with around 9000 new diagnoses in Sweden yearly. Detecting and localizing risk of breast cancer could give the opportunity for individualized examination programs and preventative measures if necessary, and potentially be lifesaving. In this study, two deep learning methods have been designed, trained and evaluated on mammograms from healthy patients whom were later diagnosed with breast cancer, to examine how well deep learning models can localize suspicious areas in mammograms. The first proposed model is a ResNet-18 regression model which predicts the pixel coordinates of the annotated target pixel in the prior mammograms. The regression model produces predictions with an average of 44.25mm between the predictions and targets on the test set, which for average sized breasts correspond to a general area of the breast, and not a specific location. The regression network is hence not able to accurately localize suspicious areas in mammograms. The second model is a U-net segmentation model that segments out a risk area in the mammograms. The segmentation model had a 25% IoU, meaning that there is on average a 25% overlap between the target area and the prediction area. 57% of the predictions of the segmentation network had some overlap with the target mask, and predictions that did not overlap with the target often marked high density areas that are traditionally associated with high risk. Overall, the segmentation model did better than the regression model, but needs further improvement before it can be considered adequate to merge with a risk value model and used in practice. However, it is evident that there is sufficient information present in many of the mammogram images to localize the risk, and the research area holds potential for future improvements.
Bröstcancer är den vanligaste cancerformen bland kvinnor, med cirka 9000 nya diagnoser i Sverige årligen. Att upptäcka och lokalisera risken för bröstcancer kan möjliggöra individualiserade undersökningsprogram och förebyggande åtgärder vid behov och kan vara livräddande. I denna studie har två djupinlärningsmodeller designats, tränats och utvärderats på mammogram från friska patienter som senare diagnostiserades med bröstcancer, för att undersöka hur väl djupinlärningsmodeller kan lokalisera misstänkta områden i mammogram. Den första föreslagna modellen är en ResNet-baserad regressionsmodell som förutsäger pixelkoordinaterna för den utmarkerade målpixeln i de friska mammogrammen. Regressionsmodellen producerar förutsägelser med ett genomsnitt på 44,25 mm mellan förutsägelserna och målpunkterna för testbilderna, vilket för medelstora bröst motsvarar ett allmänt bröstområde och inte en specifik plats i bröstet. Regressionsnätverket kan därför inte med precision lokalisera misstänkta områden i mammogram. Den andra modellen är en U-net segmenteringsmodell som segmenterar ut ett riskområde ur mammogrammen. Segmenteringsmodellen hade ett IoU på 25%, vilket innebär att det i genomsnitt fanns en 25-procentig överlappning mellan målområdet och förutsägelsen. 57% av förutsägelserna från segmenteringsnätverket hade viss överlappning med målområdet, och förutsägelser som inte överlappade med målet markerade ofta områden med hög täthet som traditionellt är förknippade med hög risk. Sammantaget presterade segmenteringsmodellen bättre än regressionsmodellen, men behöver ytterligare förbättring innan den kan anses vara adekvat nog att sammanfogas med en riskvärdesmodell och användas i praktiken. Det är dock uppenbart att det finns tillräcklig information i många av mammogrambilderna för att lokalisera risken, och att forskningsområdet har potential för framtida förbättringar.
APA, Harvard, Vancouver, ISO, and other styles
31

Lundström, Caroline, and Sara Hedberg. "Coordinating transportation services in a hospital environment using Deep Reinforcement Learning." Thesis, Uppsala universitet, Avdelningen för datalogi, 2018. http://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-355737.

Full text
Abstract:
Artificial Intelligence has in the recent years become a popular subject, many thanks to the recent progress in the area of Machine Learning and particularly to the achievements made using Deep Learning. When combining Reinforcement Learning and Deep Learning, an agent can learn a successful behavior for a given environment. This has opened the possibility for a new domain of optimization. This thesis evaluates if a Deep Reinforcement Learning agent can learn to aid transportation services in a hospital environment. A Deep Q-learning Networkalgorithm (DQN) is implemented, and the performance is evaluated compared to a Linear Regression-, a random-, and a smart agent. The result indicates that it is possible for an agent to learn to aid transportation services in a hospital environment, although it does not outperform linear regression on the most difficult task. For the more complex tasks, the learning process of the agent is unstable, and implementation of a Double Deep Q-learning Network may stabilize the process. An overall conclusion is that Deep Reinforcement Learning can perform well on these types of problems and more applied research may result in greater innovations.
APA, Harvard, Vancouver, ISO, and other styles
32

Toghiani-Rizi, Babak. "Evaluation of Deep Learning Methods for Creating Synthetic Actors." Thesis, Uppsala universitet, Institutionen för informationsteknologi, 2017. http://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-324756.

Full text
Abstract:
Recent advancements in hardware, techniques and data availability have resulted in major advancements within the field of Machine Learning and specifically in a subset of modeling techniques referred to as Deep Learning. Virtual simulations are common tools of support in training and decision making within the military. These simulations can be populated with synthetic actors, often controlled through manually implemented behaviors, developed in a streamlined process by domain doctrines and programmers. This process is often time inefficient, expensive and error prone, potentially resulting in actors unrealistically superior or inferior to human players. This thesis evaluates alternative methods of developing the behavior of synthetic actors through state-of-the-art Deep Learning methods. Through a few selected Deep Reinforcement Learning algorithms, the actors are trained in four different light weight simulations with objectives like those that could be encountered in a military simulation. The results show that the actors trained with Deep Learning techniques can learn how to perform simple as well as more complex tasks by learning a behavior that could be difficult to manually program. The results also show the same algorithm can be used to train several totally different types of behavior, thus demonstrating the robustness of these methods. This thesis finally concludes that Deep Learning techniques have, given the right tools, a good potential as alternative methods of training the behavior of synthetic actors, and to potentially replace the current methods in the future.
APA, Harvard, Vancouver, ISO, and other styles
33

Sjökvist, Henrik. "Text feature mining using pre-trained word embeddings." Thesis, KTH, Matematisk statistik, 2018. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-228536.

Full text
Abstract:
This thesis explores a machine learning task where the data contains not only numerical features but also free-text features. In order to employ a supervised classifier and make predictions, the free-text features must be converted into numerical features.  In this thesis, an algorithm is developed to perform that conversion. The algorithm uses a pre-trained word embedding model which maps each word to a vector. The vectors for multiple word embeddings belonging to the same sentence are then combined to form a single sentence embedding. The sentence embeddings for the whole dataset are clustered to identify distinct groups of free-text strings. The cluster labels are output as the numerical features. The algorithm is applied on a specific case concerning operational risk control in banking. The data consists of modifications made to trades in financial instruments. Each such modification comes with a short text string which documents the modification, a trader comment. Converting these strings to numerical trader comment features is the objective of the case study. A classifier is trained and used as an evaluation tool for the trader comment features. The performance of the classifier is measured with and without the trader comment feature. Multiple models for generating the features are evaluated. All models lead to an improvement in classification rate over not using a trader comment feature. The best performance is achieved with a model where the sentence embeddings are generated using the SIF weighting scheme and then clustered using the DBSCAN algorithm.
Detta examensarbete behandlar ett maskininlärningsproblem där data innehåller fritext utöver numeriska attribut. För att kunna använda all data för övervakat lärande måste fritexten omvandlas till numeriska värden. En algoritm utvecklas i detta arbete för att utföra den omvandlingen. Algoritmen använder färdigtränade ordvektormodeller som omvandlar varje ord till en vektor. Vektorerna för flera ord i samma mening kan sedan kombineras till en meningsvektor. Meningsvektorerna i hela datamängden klustras sedan för att identifiera grupper av liknande textsträngar. Algoritmens utdata är varje datapunkts klustertillhörighet. Algoritmen appliceras på ett specifikt fall som berör operativ risk inom banksektorn. Data består av modifikationer av finansiella transaktioner. Varje sådan modifikation har en tillhörande textkommentar som beskriver modifikationen, en handlarkommentar. Att omvandla dessa kommentarer till numeriska värden är målet med fallstudien. En klassificeringsmodell tränas och används för att utvärdera de numeriska värdena från handlarkommentarerna. Klassificeringssäkerheten mäts med och utan de numeriska värdena. Olika modeller för att generera värdena från handlarkommentarerna utvärderas. Samtliga modeller leder till en förbättring i klassificering över att inte använda handlarkommentarerna. Den bästa klassificeringssäkerheten uppnås med en modell där meningsvektorerna genereras med hjälp av SIF-viktning och sedan klustras med hjälp av DBSCAN-algoritmen.
APA, Harvard, Vancouver, ISO, and other styles
34

Johnson, Amos, and Hannes Aronsson. "Automated visual inspections for final assembly : A case study of cab assembly at Scania Oskarshamn." Thesis, Luleå tekniska universitet, Institutionen för ekonomi, teknik och samhälle, 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:ltu:diva-79401.

Full text
Abstract:
Quality inspections have seen varying degrees of automation depending on the complexity of the task and the environment. Especially in later phases of multi-stage manufacturing processes, such as final assembly in automotive industries, quality inspections are largely manual to this day. Today, emerging technologies offer both pressures and tools to increase automation. However, the current state of the research field is lacking in studies that help guide companies toward implementation. Thus, quality managers at final assembly for Scania's truck coachwork factory in Oskarshamn (MC) stipulated a thesis assignment to explore how inspections in their final assembly workshop could be automated. This assignment constitutes the purpose of this thesis project - to provide an exploratory study into existing and emerging technologies that enable automation of quality inspections at MC. This was eventually delimited to exploring automated visual inspection technologies. In order to better understand Scania's inspection and manufacturing system, a series of interviews and shadowings were undertaken with appropriate respondents. From these, we were able to extract seven inspection system requirements, most important were the ability to (1) handle high variability, (2) add new inspections fast, (3) inspect in direct flow and (4) inspect inside and outside of the truck coach without disassembly. Then, a thorough and comprehensive review of 559 active inspections allowed us to categorize and map the nature of inspections at MC. In our literature review, a model for a general quality inspections was found, which was used to guide and ground our proposals and recommendations as well as provided intuitive illustration. Further, two paradigms emerged as most interesting for this project: machine vision and deep learning. A theoretical comparison of the two suggested that the more traditional, rule-based machine vision algorithms would struggle in accommodating the requirements previously found. However, we could infer that deep learning would be highly suitable with respect to MC's requirements and inspections. A prototype deep learning inspection system gave further validation toward our speculations that deep learning offered the greatest potential for automation in complex environments such as MC's. Although this thesis was created for Scania as a primary customer, important theoretical and practical contributions were developed for a more general audience. Firstly, the exploration into new avenues for automation that overcome their traditional limitations were provided; something that is of high current import given the trends toward more complex manufacturing settings. Practically, we provide some guidance to industries that find themselves in similar situations to Scania - employing complex manufacturing systems or having complex products - where our findings can give insights in regards to modern automation challenges and solutions.
Kvalitetsinspektioner har automatiserats i variarande grad beroende på uppgiftens och omgivningens komlexitet. I synnerhet i de senare stadierna av flerstegsproduktioner, exempelvis slutmontering i fordonstillverkningsindustrin, består manuella inspektioner i stor utsträckning. Den snabba tekniska utvecklingen som har skett nyligen avger både ett tryck och skapar verktyg för att utöka automatiseringen. Dessvärre erbjuder dagslägets forskning föga stöd till företag gällande storskalig implementering av automatiserade kvalitetsinspektionssystem. Därför skapade kvalitetschefer på Scanias lastbilshyttmonteringsfabrik i Oskarshamn (MC) ett uppdrag att utforska hur deras inspektioner skulle kunna automatiseras. Detta uppdrag utgjorde syftet i vårt examensarbete: att utföra en explorativ studie inom befintliga och nya tekniker som möjliggör automatisering av MCs kvalitetsinpspektioner, vilket senare avgränsades till undersökandet av visuella kvalitetsinspektioner. För att tillgodogöra oss en djupare förståelse för Scanias inspektions- och produktionssytem utfördes en serie intervjuer och skuggningar med kunniga respondenter. Datan som erhölls utgjorde grunden i en nulägesanalys, från vilken sju systemkrav för ett inspektionssystem på MC kunde extraheras. De viktigaste av dessa var förmågan att (1) klara av hög variation, (2) addera nya inspektionspunkter snabbt, (3) kontrollera i direktflödet och (4) kontrollera innan- och utanför lastbilshytten. Vidare gjordes en omfattande genomgång av 559 aktiva inspektionspunkter vilket resulterade i en kategorisering och kartläggning av inspektioner på MC. I vår genomgång av relevant vetenskaplig litteratur hittades en generell modell för kvalitetskontroll som användes för att illustrera och teroretiskt förankra rekommendationer för ett automatiskt inspektionssystem. Vidare urskiljdes två intressanta områden i forskningen, machine vision och deep learning. En teoretisk jämförelse av traditionella regelbaserade machine vision algoritmer med deep learning erhöll att den förstnämnda är mindre lämpad för Scania med hänsyn till de krav som tagits fram. Deep learning å andra sidan, erbjuder många fördelar i relation till dessa. Genom en relativt enkel process kunde en deep learning baserad prototyp utvecklas. Prototypen påvisade goda resultat och gav vidare validering av vår spekulation att deep learning är ett lämpligt verktyg för automatisering i komplexa miljöer.Trots att detta examensarbete hade Scania som huvudsaklig uppdragsgivare så gjordes viktiga teoretiska och praktiska bidrag. En utforskning av i nya möjligheter för automatisering som kan överkomma begränsningarna av traditionell automatisering framtogs, vilket anses som både aktuellt och av vikt för samtiden där trender går mot mer dynamiska produktionssystem. Vad gäller praktiska bidrag så utgör denna rapport en sammanställning av råd till företag som befinner sig i liknande sitser som Scania - som använder komplexa produktionssystem eller har komplexa produkter - där våra resultat kan ge insikt gällande svårigheter och lösningar för modern automatisering.
APA, Harvard, Vancouver, ISO, and other styles
35

Wenger, Jakob. "AI-vision som tillämpning i en stålindustri : Med inriktning på objektdetektering & bildklassificering." Thesis, Högskolan i Gävle, Avdelningen för elektroteknik, matematik och naturvetenskap, 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:hig:diva-32885.

Full text
Abstract:
I takt med att industri 4.0 sveper över dagens industrier så utvecklas tillämpningsområden inom artificiell intelligens (AI). En relativt nyfunnen tillämpning som vanligen benämns AI-vision eller Computer-vision, inom detta arbete har benämningen AI-vision valts. Tillämpningen handlar om att datorer och maskiner upprättas med förmågan att tolka visuellt innehåll.I och med detta tränas en intelligent modell som klarar av att fatta beslut utifrån visuell data, såsom bild och video. Inriktningen i arbetet belyser inom AI-Vision teknikerna objektdetektering och bildklassificering. Objektdetektering innebär att ett eller flera specifika objekt upptäcks från en bild av flera komplexa linjer och former. Tekniken används inom en rad olika tillämpningar såsom t.ex. robotnavigering och automatisk fordonsstyrning. Syftet med bildklassificering ibland kallat bildigenkänning, handlar om att klassificera och kategorisera bilden genom att identifiera och sortera väsentlig data. Detta i försök att konstatera vad bilden i sig föreställer. För att forma och rama in detta arbete på ett lämpligt sätt ämnas huvudsakliga målet med arbetet beskriva hur tekniker såsom objektdetektering och bildklassificerings-modeller konstrueras. Så även redogöra kring bakomliggande intelligens i modellerna, samt vilka verktyg och metoder som används för att skapa dessa modeller. Arbetet syftar även till att presentera presumtiva tillämpningar inom en stålindustri, därför kommer förslag till applikationer framföras. I resultatdelen av arbetet presenteras i huvudsak uppbyggnaden av en objekdetekteringsapplikation som hanterar personsäkerhet och i diskussionsdelen framhävs vidare förslag till applikationer. Detta avses lägga grund för eventuell implementation i verkliga produktionsutrustningar i framtiden.
As Industry 4.0 sweeps across today's industries, applications within artificial intelligence (AI) are developing. A relatively new application that is commonly called AI-vision or sometimes Computer-vision, in this study the term AI-vision is used. The application is about making computers and machines visually inclined. With this, an intelligent model is trained that can make decisions based on visual data, such as image and video. The orientation in this study within AI-Vision, is to highlight object detection and image classification. Object detection defines as follows, one or more specific objects are detected from an image of several complex lines and shapes. The technology is used in a variety of applications such as robot navigation and automatic vehicle control. The purpose of image classification, sometimes called image recognition, is to classify and categorize the image by identifying and sorting essential data. This in attempt to ascertain what the image itself represents. In order to frame this work in an appropriate way, the main quest of this thesis is to describe how techniques such as Object Detection and Image Classification models are constructed. Explain the underlying intelligence in the models as well as what tools and methods are used to create these models. As the thesis also alludes to present prospective applications in a steel industry, proposals of specific applications will be presented. The results section mainly presents an Object Detection application that handles personal safety and drafts to applications is presented in the discussion section. This work intends to contribute for possible implementation in production equipment in the future.
APA, Harvard, Vancouver, ISO, and other styles
36

Alpire, Adam. "Predicting Solar Radiation using a Deep Neural Network." Thesis, KTH, Skolan för informations- och kommunikationsteknik (ICT), 2017. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-215715.

Full text
Abstract:
Simulating the global climate in fine granularity is essential in climate science research. Current algorithms for computing climate models are based on mathematical models that are computationally expensive. Climate simulation runs can take days or months to execute on High Performance Computing (HPC) platforms. As such, the amount of computational resources determines the level of resolution for the simulations. If simulation time could be reduced without compromising model fidelity, higher resolution simulations would be possible leading to potentially new insights in climate science research. In this project, broadband radiative transfer modeling is examined, as this is an important part in climate simulators that takes around 30% to 50% time of a typical general circulation model. This thesis project presents a convolutional neural network (CNN) to model this most time consuming component. As a result, swift radiation prediction through the trained deep neural network achieves a 7x speedup compared to the calculation time of the original function. The average prediction error (MSE) is around 0.004 with 98.71% of accuracy.
Högupplösta globala klimatsimuleringar är oumbärliga för klimatforskningen.De algoritmer som i dag används för att beräkna klimatmodeller baserar sig på matematiska modeller som är beräkningsmässigt tunga. Klimatsimuleringar kan ta dagar eller månader att utföra på superdator (HPC). På så vis begränsas detaljnivån av vilka datorresurser som finns tillgängliga. Om simuleringstiden kunde minskas utan att kompromissa på modellens riktighet skulle detaljrikedomen kunna ökas och nya insikter göras möjliga. Detta projekt undersöker Bredband Solstrålning modellering eftersom det är en betydande del av dagens klimatsimulationer och upptar mellan 30-50% av beräkningstiden i en typisk generell cirkulationsmodell (GCM). Denna uppsats presenterar ett neuralt faltningsnätverk som ersätter denna beräkningsintensiva del. Resultatet är en sju gångers uppsnabbning jämfört med den ursprungliga metoden. Genomsnittliga uppskattningsfelet är 0.004 med 98.71 procents noggrannhet.
APA, Harvard, Vancouver, ISO, and other styles
37

Ben, Qingyan. "Flight Sorting Algorithm Based on Users’ Behaviour." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-294132.

Full text
Abstract:
The model predicts the best flight order and recommend best flight to users. The thesis could be divided into the following three parts: Feature choosing, data-preprocessing, and various algorithms experiment. For feature choosing, besides the original information of flight itself, we add the user’s selection status into our model, which the flight class is, together with children or not. In the data preprocessing stage, data cleaning is used to process incomplete and repeated data. Then a normalization method removes the noise in the data. After various balancing processing, the class-imbalance data is corrected best with SMOTE method. Based on our existing data, I choose the classification model and Sequential ranking algorithm. Use price, direct flight or not, travel time, etc. as features, and click or not as label. The classification algorithms I used includes Logistic Regression, Gradient Boosting, KNN, Decision Tree, Random Forest, Gaussian Process Classifier, Gaussian NB Bayesian and Quadratic Discriminant Analysis. In addition, we also adopted Sequential ranking algorithm. The results show that Random Forest-SMOTE performs best with AUC of ROC=0.94, accuracy=0.8998.
Modellen förutsäger den bästa flygordern och rekommenderar bästa flyg till användarna. Avhandlingen kan delas in i följande tre delar: Funktionsval, databehandling och olika algoritms experiment. För funktionsval, förutom den ursprungliga informationen om själva flygningen, lägger vi till användarens urvalsstatus i vår modell, vilken flygklassen är , tillsammans med barn eller inte. Datarengöring används för att hantera dubbletter och ofullständiga data. Därefter tar en normaliserings metod bort bruset i data. Efter olika balanserings behandlingar är SMOTE-metoden mest lämplig för att korrigera klassobalans flyg data. Baserat på våra befintliga data väljer jag klassificerings modell och sekventiell ranknings algoritm. Använd pris, direktflyg eller inte, restid etc. som funktioner, och klicka eller inte som etikett. Klassificerings algoritmerna som jag använde inkluderar Logistic Regression, Gradient Boost, KNN, Decision Tree, Random Forest, Gaussian Process Classifier, Gaussian NB Bayesian and Quadratic Discriminant Analysis. Dessutom antog vi också Sequential ranking algoritm. Resultaten visar att Random Forest-SMOTE presterar bäst med AUC för ROC = 0.94, noggrannhet = 0.8998.
APA, Harvard, Vancouver, ISO, and other styles
38

Nilsson, Viktor. "Prediction of Dose Probability Distributions Using Mixture Density Networks." Thesis, KTH, Matematisk statistik, 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-273610.

Full text
Abstract:
In recent years, machine learning has become utilized in external radiation therapy treatment planning. This involves automatic generation of treatment plans based on CT-scans and other spatial information such as the location of tumors and organs. The utility lies in relieving clinical staff from the labor of manually or semi-manually creating such plans. Rather than predicting a deterministic plan, there is great value in modeling it stochastically, i.e. predicting a probability distribution of dose from CT-scans and delineated biological structures. The stochasticity inherent in the RT treatment problem stems from the fact that a range of different plans can be adequate for a patient. The particular distribution can be thought of as the prevalence in preferences among clinicians. Having more information about the range of possible plans represented in one model entails that there is more flexibility in forming a final plan. Additionally, the model will be able to reflect the potentially conflicting clinical trade-offs; these will occur as multimodal distributions of dose in areas where there is a high variance. At RaySearch, the current method for doing this uses probabilistic random forests, an augmentation of the classical random forest algorithm. A current direction of research is learning the probability distribution using deep learning. A novel parametric approach to this is letting a suitable deep neural network approximate the parameters of a Gaussian mixture model in each volume element. Such a neural network is known as a mixture density network. This thesis establishes theoretical results of artificial neural networks, mainly the universal approximation theorem, applied to the activation functions used in the thesis. It will then proceed to investigate the power of deep learning in predicting dose distributions, both deterministically and stochastically. The primary objective is to investigate the feasibility of mixture density networks for stochastic prediction. The research question is the following. U-nets and Mixture Density Networks will be combined to predict stochastic doses. Does there exist such a network, powerful enough to detect and model bimodality? The experiments and investigations performed in this thesis demonstrate that there is indeed such a network.
Under de senaste åren har maskininlärning börjat nyttjas i extern strålbehandlingsplanering. Detta involverar automatisk generering av behandlingsplaner baserade på datortomografibilder och annan rumslig information, såsom placering av tumörer och organ. Nyttan ligger i att avlasta klinisk personal från arbetet med manuellt eller halvmanuellt skapa sådana planer. I stället för att predicera en deterministisk plan finns det stort värde att modellera den stokastiskt, det vill säga predicera en sannolikhetsfördelning av dos utifrån datortomografibilder och konturerade biologiska strukturer. Stokasticiteten som förekommer i strålterapibehandlingsproblemet beror på att en rad olika planer kan vara adekvata för en patient. Den särskilda fördelningen kan betraktas som förekomsten av preferenser bland klinisk personal. Att ha mer information om utbudet av möjliga planer representerat i en modell innebär att det finns mer flexibilitet i utformningen av en slutlig plan. Dessutom kommer modellen att kunna återspegla de potentiellt motstridiga kliniska avvägningarna; dessa kommer påträffas som multimodala fördelningar av dosen i områden där det finns en hög varians. På RaySearch används en probabilistisk random forest för att skapa dessa fördelningar, denna metod är en utökning av den klassiska random forest-algoritmen. En aktuell forskningsriktning är att generera in sannolikhetsfördelningen med hjälp av djupinlärning. Ett oprövat parametriskt tillvägagångssätt för detta är att låta ett lämpligt djupt neuralt nätverk approximera parametrarna för en Gaussisk mixturmodell i varje volymelement. Ett sådant neuralt nätverk är känt som ett mixturdensitetsnätverk. Den här uppsatsen fastställer teoretiska resultat för artificiella neurala nätverk, främst det universella approximationsteoremet, tillämpat på de aktiveringsfunktioner som används i uppsatsen. Den fortsätter sedan att utforska styrkan av djupinlärning i att predicera dosfördelningar, både deterministiskt och stokastiskt. Det primära målet är att undersöka lämpligheten av mixturdensitetsnätverk för stokastisk prediktion. Forskningsfrågan är följande. U-nets och mixturdensitetsnätverk kommer att kombineras för att predicera stokastiska doser. Finns det ett sådant nätverk som är tillräckligt kraftfullt för att upptäcka och modellera bimodalitet? Experimenten och undersökningarna som utförts i denna uppsats visar att det faktiskt finns ett sådant nätverk.
APA, Harvard, Vancouver, ISO, and other styles
39

Rintala, Jonathan. "Speech Emotion Recognition from Raw Audio using Deep Learning." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-278858.

Full text
Abstract:
Traditionally, in Speech Emotion Recognition, models require a large number of manually engineered features and intermediate representations such as spectrograms for training. However, to hand-engineer such features often requires both expert domain knowledge and resources. Recently, with the emerging paradigm of deep-learning, end-to-end models that extract features themselves and learn from the raw speech signal directly have been explored. A previous approach has been to combine multiple parallel CNNs with different filter lengths to extract multiple temporal features from the audio signal, and then feed the resulting sequence to a recurrent block. Also, other recent work present high accuracies when utilizing local feature learning blocks (LFLBs) for reducing the dimensionality of a raw audio signal, extracting the most important information. Thus, this study will combine the idea of LFLBs for feature extraction with a block of parallel CNNs with different filter lengths for capturing multitemporal features; this will finally be fed into an LSTM layer for global contextual feature learning. To the best of our knowledge, such a combined architecture has yet not been properly investigated. Further, this study will investigate different configurations of such an architecture. The proposed model is then trained and evaluated on the well-known speech databases EmoDB and RAVDESS, both in a speaker-dependent and speaker-independent manner. The results indicate that the proposed architecture can produce comparable results with state-of-the-art; despite excluding data augmentation and advanced pre-processing. It was reported 3 parallel CNN pipes yielded the highest accuracy, together with a series of modified LFLBs that utilize averagepooling and ReLU activation. This shows the power of leaving the feature learning up to the network and opens up for interesting future research on time-complexity and trade-off between introducing complexity in pre-processing or in the model architecture itself.
Traditionellt sätt, vid talbaserad känsloigenkänning, kräver modeller ett stort antal manuellt konstruerade attribut och mellanliggande representationer, såsom spektrogram, för träning. Men att konstruera sådana attribut för hand kräver ofta både domänspecifika expertkunskaper och resurser. Nyligen har djupinlärningens framväxande end-to-end modeller, som utvinner attribut och lär sig direkt från den råa ljudsignalen, undersökts. Ett tidigare tillvägagångssätt har varit att kombinera parallella CNN:er med olika filterlängder för att extrahera flera temporala attribut från ljudsignalen och sedan låta den resulterande sekvensen passera vidare in i ett så kallat Recurrent Neural Network. Andra tidigare studier har också nått en hög noggrannhet när man använder lokala inlärningsblock (LFLB) för att reducera dimensionaliteten hos den råa ljudsignalen, och på så sätt extraheras den viktigaste informationen från ljudet. Således kombinerar denna studie idén om att nyttja LFLB:er för extraktion av attribut, tillsammans med ett block av parallella CNN:er som har olika filterlängder för att fånga multitemporala attribut; detta kommer slutligen att matas in i ett LSTM-lager för global inlärning av kontextuell information. Så vitt vi vet har en sådan kombinerad arkitektur ännu inte undersökts. Vidare kommer denna studie att undersöka olika konfigurationer av en sådan arkitektur. Den föreslagna modellen tränas och utvärderas sedan på de välkända taldatabaserna EmoDB och RAVDESS, både via ett talarberoende och talaroberoende tillvägagångssätt. Resultaten indikerar att den föreslagna arkitekturen kan ge jämförbara resultat med state-of-the-art, trots att ingen ökning av data eller avancerad förbehandling har inkluderats. Det rapporteras att 3 parallella CNN-lager gav högsta noggrannhet, tillsammans med en serie av modifierade LFLB:er som nyttjar average-pooling och ReLU som aktiveringsfunktion. Detta visar fördelarna med att lämna inlärningen av attribut till nätverket och öppnar upp för intressant framtida forskning kring tidskomplexitet och avvägning mellan introduktion av komplexitet i förbehandlingen eller i själva modellarkitekturen.
APA, Harvard, Vancouver, ISO, and other styles
40

Chu, Gongchang. "Machine Learning for Automation of Chromosome based Genetic Diagnostics." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-286284.

Full text
Abstract:
Chromosome based genetic diagnostics, the detection of specific chromosomes, plays an increasingly important role in medicine as the molecular basis of hu- man disease is defined. The current diagnostic process is performed mainly by karyotyping specialists. They first put chromosomes in pairs and generate an image listing all the chromosome pairs in order. This process is called kary- otyping, and the generated image is called karyogram. Then they analyze the images based on the shapes, size, and relationships of different image segments and then make diagnostic decisions. Manual inspection is time-consuming, labor-intensive, and error-prone.This thesis investigates supervised methods for genetic diagnostics on karyo- grams. Mainly, the theory targets abnormality detection and gives the confi- dence of the result in the chromosome domain. This thesis aims to divide chromosome pictures into normal and abnormal categories and give the con- fidence level. The main contributions of this thesis are (1) an empirical study of chromosome and karyotyping; (2) appropriate data preprocessing; (3) neu- ral networks building by using transfer learning; (4) experiments on different systems and conditions and comparison of them; (5) a right choice for our requirement and a way to improve the model; (6) a method to calculate the confidence level of the result by uncertainty estimation.Empirical research shows that the karyogram is ordered as a whole, so preprocessing such as rotation and folding is not appropriate. It is more rea- sonable to choose noise or blur. In the experiment, two neural networks based on VGG16 and InceptionV3 were established using transfer learning and com- pared their effects under different conditions. We hope to minimize the error of assuming normal cases because we cannot accept that abnormal chromo- somes are predicted as normal cases. This thesis describes how to use Monte Carlo Dropout to do uncertainty estimation like a non-Bayesian model[1].
Kromosombaserad genetisk diagnostik, detektering av specifika kromosomer, kommer att spela en allt viktigare roll inom medicin eftersom den molekylära grunden för mänsklig sjukdom definieras. Den nuvarande diagnostiska pro- cessen utförs huvudsakligen av specialister på karyotypning. De sätter först kromosomer i par och genererar en bild som listar alla kromosompar i ord- ning. Denna process kallas karyotypning, och den genererade bilden kallas karyogram. Därefter analyserar de bilderna baserat på former, storlek och för- hållanden för olika bildsegment och fattar sedan diagnostiska beslut.Denna avhandling undersöker övervakade metoder för genetisk diagnostik på karyogram. Huvudsakligen riktar teorin sig mot onormal detektion och ger förtroendet för resultatet i kromosomdomänen. Manuell inspektion är tidskrä- vande, arbetskrävande och felbenägen. Denna uppsats syftar till att dela in kro- mosombilder i normala och onormala kategorier och ge konfidensnivån. Dess huvudsakliga bidrag är (1) en empirisk studie av kromosom och karyotyp- ning; (2) lämplig förbehandling av data; (3) Neurala nätverk byggs med hjälp av transfer learning; (4) experiment på olika system och förhållanden och jäm- förelse av dem; (5) ett rätt val för vårt krav och ett sätt att förbättra modellen;    en metod för att beräkna resultatets konfidensnivå genom osäkerhetsupp- skattning.    Empirisk forskning visar att karyogrammet är ordnat som en helhet, så förbehandling som rotation och vikning är inte lämpligt. Det är rimligare att välja brus, oskärpa etc. I experimentet upprättades två neurala nätverk base- rade på VGG16 och InceptionV3 med hjälp av transfer learning och jämförde deras effekter under olika förhållanden. När vi väljer utvärderingsindikatorer, eftersom vi inte kan acceptera att onormala kromosomer bedöms förväntas, hoppas vi att minimera felet att anta som vanligt. Denna avhandling beskriver hur man använder Monte Carlo Dropout för att göra osäkerhetsberäkningar som en icke-Bayesisk modell [1].
APA, Harvard, Vancouver, ISO, and other styles
41

Hjalmarsson, Martin, and Mikael Björkman. "Bedömning av fakturor med hjälp av maskininlärning." Thesis, Örebro universitet, Institutionen för naturvetenskap och teknik, 2017. http://urn.kb.se/resolve?urn=urn:nbn:se:oru:diva-64835.

Full text
Abstract:
Factoring innebär försäljning av fakturor till tredjepart och därmed möjlighet att få in kapital snabbt och har blivit alltmer populärt bland företag idag. Ett fakturaköp innebär en viss kreditrisk för företaget i de fall som fakturan inte blir betald och som köpare av kapital önskar man att minimera den risken. Aros Kapital erbjuder sina kunder tjänsten factoring. Under detta projekt undersöks möjligheten att använda maskininlärningsmetoder för att bedöma om en faktura är en bra eller dålig investering. Om maskininlärningen visar sig vara bättre än manuell hantering kan även bättre resultat uppnås i form av minskade kreditförluster, köp av fler fakturor och därmed ökad vinst. Fyra maskininlärningsmetoder jämfördes: beslutsträd, slumpmässig skog, Adaboost och djupa neurala nätverk. Utöver jämförelse sinsemellan har metoderna jämförts med Aros befintliga beslut och nuvarande regelmotor. Av de jämförda maskininlärningsmetoderna presterade slumpmässig skog bäst och visade sig bättre än Aros befintliga beslut på de testade fakturorna, slumpmässig skog fick F1-poängen 0,35 och Aros 0,22 .
Today, companies can sell their invoices to a third party in order to to quickly capitalize them. This is called factoring. For the financial institute which serve as the third party, the purchase of an invoice infers a certain risk in case the invoice is not paid, a risk the financial institute would like to minimize. Aros Kapital is a financial institute that offers factoring as one of their services. This project at Aros Kapital evaluated the possibility of using machine learning to determine whether or not an invoice will be good investment for the financial institute. If the machine learning algorithm performs better than manual handling and by minimizing credit losses and buying more invoices this could lead to an increase in profit for Aros. Four machine learning algorithms have been compared: decision trees, random forest, Adaboost and deep neural network. Beyond the comparison between the four algorithms, the algorithms were also compared with Aros actual decision and Aros current rule engine solution. The  results show that random forest is the best performing algorithm and it also shows a slight improvement on performance compared to Aros actual decision, random forest got an F1- core of 0.35 and Aros 0.22.
APA, Harvard, Vancouver, ISO, and other styles
42

Ekelund, Måns. "Uncertainty Estimation for Deep Learning-based LPI Radar Classification : A Comparative Study of Bayesian Neural Networks and Deep Ensembles." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-301653.

Full text
Abstract:
Deep Neural Networks (DNNs) have shown promising results in classifying known Low-probability-of-intercept (LPI) radar signals in noisy environments. However, regular DNNs produce low-quality confidence and uncertainty estimates, making them unreliable, which inhibit deployment in real-world settings. Hence, the need for robust uncertainty estimation methods has grown, and two categories emerged, Bayesian approximation and ensemble learning. As autonomous LPI radar classification is deployed in safety-critical environments, this study compares Bayesian Neural Networks (BNNs) and Deep Ensembles (DEs) as uncertainty estimation methods. We synthetically generate a training and test data set, as well as a shifted data set where subtle changes are made to the signal parameters. The methods are evaluated on predictive performance, relevant confidence and uncertainty estimation metrics, and method-related metrics such as model size, training, and inference time. Our results show that our DE achieves slightly higher predictive performance than the BNN on both in-distribution and shifted data with an accuracy of 74% and 32%, respectively. Further, we show that both methods exhibit more cautiousness in their predictions compared to a regular DNN for in-distribution data, while the confidence quality significantly degrades on shifted data. Uncertainty in predictions is evaluated as predictive entropy, and we show that both methods exhibit higher uncertainty on shifted data. We also show that the signal-to-noise ratio affects uncertainty compared to a regular DNN. However, none of the methods exhibit uncertainty when making predictions on unseen signal modulation patterns, which is not a desirable behavior. Further, we conclude that the amount of available resources could influence the choice of the method since DEs are resource-heavy, requiring more memory than a regular DNN or BNN. On the other hand, the BNN requires a far longer training time.
Tidigare studier har visat att djupa neurala nätverk (DNN) kan klassificera signalmönster för en speciell typ av radar (LPI) som är skapad för att vara svår att identifiera och avlyssna. Traditionella neurala nätverk saknar dock ett naturligt sätt att skatta osäkerhet, vilket skadar deras pålitlighet och förhindrar att de används i säkerhetskritiska miljöer. Osäkerhetsskattning för djupinlärning har därför vuxit och på senare tid blivit ett stort område med två tydliga kategorier, Bayesiansk approximering och ensemblemetoder. LPI radarklassificering är av stort intresse för försvarsindustrin, och tekniken kommer med största sannolikhet att appliceras i säkerhetskritiska miljöer. I denna studie jämför vi Bayesianska neurala nätverk och djupa ensembler för LPI radarklassificering. Resultaten från studien pekar på att en djup ensemble uppnår högre träffsäkerhet än ett Bayesianskt neuralt nätverk och att båda metoderna uppvisar återhållsamhet i sina förutsägelser jämfört med ett traditionellt djupt neuralt nätverk. Vi skattar osäkerhet som entropi och visar att osäkerheten i metodernas slutledningar ökar både på höga brusnivåer och på data som är något förskjuten från den kända datadistributionen. Resultaten visar dock att metodernas osäkerhet inte ökar jämfört med ett vanligt nätverk när de får se tidigare osedda signal mönster. Vi visar också att val av metod kan influeras av tillgängliga resurser, eftersom djupa ensembler kräver mycket minne jämfört med ett traditionellt eller Bayesianskt neuralt nätverk.
APA, Harvard, Vancouver, ISO, and other styles
43

El-Hage, Sebastian. "Predicting Purchase of Airline Seating Using Machine Learning." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-280461.

Full text
Abstract:
With the continuing surge in digitalization within the travel industry and the increased demand of personalized services, understanding customer behaviour is becoming a requirement to survive for travel agencies. The number of cases that addresses this problem are increasing and machine learning is expected to be the enabling technique. This thesis will attempt to train two different models, a multi-layer perceptron and a support vector machine, to reliably predict whether a customer will add a seat reservation with their flight booking. The models are trained on a large dataset consisting of 69 variables and over 1.1 million historical recordings of bookings dating back to 2017. The results from the trained models are satisfactory and the models are able to classify the data with an accuracy of around 70%. This shows that this type of problem is solvable with the techniques used. The results moreover suggest that further exploration of models and additional data could be of interest since this could help increase the level of performance.
Med den fortsatta ökningen av digitalisering inom reseindustrin och det faktum att kunder idag visar ett stort behov av skräddarsydda tjänster så stiger även kraven på företag att förstå sina kunders beteende för att överleva. En uppsjö av studier har gjorts där man försökt tackla problemet med att kunna förutse kundbeteende och maskininlärning har pekats ut som en möjliggörande teknik. Inom maskininlärning har det skett en stor utveckling och specifikt inom området djupinlärning. Detta har gjort att användningen av dessa teknologier för att lösa komplexa problem spritt sig till allt fler branscher. Den här studien implementerar en Multi-Layer Perceptron och en Support Vector Machine och tränar dessa på befintliga data för att tillförlitligt kunna avgöra om en kund kommer att köpa en sätesreservation eller inte till sin bokning. Datat som användes bestod av 69 variabler och över 1.1 miljoner historiska bokningar inom tidsspannet 2017 till 2020. Resultaten från studien är tillfredställande då modellerna i snitt lyckas klassificera med en noggrannhet på 70%, men inte optimala. Multi-Layer Perceptronen presterar bäst på båda mätvärdena som användes för att estimera prestandan på modellerna, accuracy och F1 score. Resultaten pekar även på att en påbyggnad av denna studie med mer data och fler klassificeringsmodeller är av intresse då detta skulle kunna leda till en högre nivå av prestanda.
APA, Harvard, Vancouver, ISO, and other styles
44

Skowronek, Adam, and Oleksandr Kuleshov. "Eye Tracking Using a Smartphone Camera and Deep Learning." Thesis, KTH, Skolan för kemi, bioteknologi och hälsa (CBH), 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-290168.

Full text
Abstract:
Tracking eye movements has been a central part in understanding attention and visual processing in the mind. Studying how the eyes move and what they fixate on during specific moments has been considered by some to offer a direct way to measure spatial attention. The underlying technology, known as eye tracking, has been used in order to reliably and accurately measure gaze. Despite the numerous benefits of eye tracking, research and development as well as commercial applications have been limited due to the cost and lack of scalability which the technology usually entails. The purpose and goal of this project is to make eye tracking more available to the common user by implementing and evaluating a new promising technique. The thesis explores the possibility of implementing a gaze tracking prototype using a normal smartphone camera. The hypothesis is to achieve accurate gaze estimation by utilizing deep learning neural networks and personalizing them to fit each individual. The resulting prototype is highly inaccurate in its estimations; however, adjusting a few key components such as the neural network initialization weights may lead to improved results.
Att spåra ögonrörelser har varit en central del i att förstå uppmärksamhet och visuell bearbetning i hjärnan. Att studera hur ögonen rör sig och vad de fokuserar på under specifika moment har av vissa ansetts vara ett sätt att mäta visuell uppmärksamhet. Den bakomliggande tekniken, känd som blickspårning, har använts för att pålitligt och noggrant mäta blickens riktning. Trots de fördelar som finns med blickspårning, har forskning och utveckling samt även kommersiella produkter begränsats av kostnaden och oförmågan till skalbarhet som tekniken ofta medför. Syftet och målet med arbetet är att göra blickspårning mer tillgängligt för vardagliga användare genom att implementera och utvärdera en ny lovande teknik. Arbetet undersöker möjligheten att implementera en blickspårningsprototyp genom användning av en vanlig mobilkamera. Hypotesen är att uppnå noggrann blickspårning genom användning av djupinlärning och neuronnät, samt att personalisera dem till att passa den enskilda individen. Den resulterande prototypen är väldigt oprecis i dess uppskattning av blickriktningen, dock kan justeringen av ett fåtal nyckelkomponenter, som initialiseringsvikterna till det neurala nätverket leda till bättre resultat.
APA, Harvard, Vancouver, ISO, and other styles
45

Guillen, Rosaperez Diego Alonso. "Self-Learning Methodology for Failure Detection in an Oil- Hydraulic Press : Predictive maintenance." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-289371.

Full text
Abstract:
Deep Learning methods have dramatically improved the state-of-the-art across multiple fields, such as speech recognition, object detection, among others. Nevertheless, its application on signal processing, where data is frequently unlabelled, has received relatively little attention. In this field, nowadays, a set of sub-optimal techniques are often used. They usually require an expert to manually extract features to analyse, which is a knowledge and labour intensive process. Thus, a self-learning technique could improve current methods. Moreover, certain machines in a factory are particularly complex, such as an oil-hydraulic press. Here, its sensors can only identify few failures by setting up some thresholds, but they commonly cannot detect wear on its internal components. So, a self-learning technique would be required to detect anomalies related to deterioration. The concept is to determine the condition of a machine and to predict breakdowns by analysing patterns in the measurements from their sensors. This document proposes a self-learning methodology that uses a deep learning model to predict failures in such a machine. The core idea is to train an algorithm that can identify by itself the relevant features to extract on a work cycle, and to relate them to a part which will breakdown. The conducted evaluation focuses on an example case where a hydraulic accumulator fails. As result, it was possible to forecast its breakdown two weeks in advance. Finally, the proposed method provides explanations at every step, after acknowledging their importance in industrial applications. Also, some considerations and limitations of this technique are stated to support guiding the expectation of some stakeholders in a factory, i.e. a (Global) Process Owner.
Deep Learning-metoder har dramatiskt förbättrat det senaste inom flera  fält, såsom taligenkänning, objektdetektering, bland andra.  Ändå har dess  tillämpning på signalbehandling, där data ofta är omärkt, fått relativt lite uppmärksamhet. I detta fält används numera ofta en uppsättning suboptimala tekniker. De kräver vanligtvis en expert för att manuellt extrahera funktioner för att analysera, vilket är en kunskaps och arbetsintensiv process. Således kan en självlärande teknik förbättra nuvarande metoder.   Dessutom är vissa maskiner i en fabrik särskilt komplexa, såsom en oljehydraulisk press. Här kan dess sensorer bara identifiera några fel genom att ställa in vissa trösklar, men de kan vanligtvis inte upptäcka slitage på dess interna komponenter. Så, en självlärande teknik skulle krävas för att upptäcka avvikelser relaterade till försämring. Konceptet är att bestämma maskinens tillstånd och att förutsäga haverier genom att analysera mönster i mätningarna från deras sensorer.   Detta dokument föreslår en självlärningsmetodik som använder en djupinlärningsmodell för att förutsäga fel i en sådan maskin. Kärnidén är att träna en algoritm som i sig kan identifiera de relevanta funktionerna som ska extraheras i en arbetscykel och att relatera dem till en del som kommer att bryta ner. Den genomförda utvärderingen fokuserar på ett exempel på fall där en hydraulisk ackumulator misslyckas. Som ett resultat var det möjligt att förutse dess fördelning två veckor i förväg.   Slutligen ger den föreslagna metoden förklaringar i varje steg, efter att ha erkänt deras betydelse i industriella applikationer. Några överväganden och begränsningar av denna teknik anges också som stöd för att vägleda förväntningarna hos vissa intressenter i en fabrik, dvs. en (global) processägare.
APA, Harvard, Vancouver, ISO, and other styles
46

Ljung, Mikael. "Synthetic Data Generation for the Financial Industry Using Generative Adversarial Networks." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-301307.

Full text
Abstract:
Following the introduction of new laws and regulations to ensure data protection in GDPR and PIPEDA, interests in technologies to protect data privacy have increased. A promising research trajectory in this area is found in Generative Adversarial Networks (GAN), an architecture trained to produce data that reflects the statistical properties of its underlying dataset without compromising the integrity of the data subjects. Despite the technology’s young age, prior research has made significant progress in the generation process of so-called synthetic data, and the current models can generate images with high-quality. Due to the architecture’s success with images, it has been adapted to new domains, and this study examines its potential to synthesize financial tabular data. The study investigates a state-of-the-art model within tabular GANs, called CTGAN, together with two proposed ideas to enhance its generative ability. The results indicate that a modified training dynamic and a novel early stopping strategy improve the architecture’s capacity to synthesize data. The generated data presents realistic features with clear influences from its underlying dataset, and the inferred conclusions on subsequent analyses are similar to those based on the original data. Thus, the conclusion is that GANs has great potential to generate tabular data that can be considered a substitute for sensitive data, which could enable organizations to have more generous data sharing policies.
Med striktare förhållningsregler till hur data ska hanteras genom GDPR och PIPEDA har intresset för anonymiseringsmetoder för att censurera känslig data aktualliserats. En lovande teknik inom området återfinns i Generativa Motstridande Nätverk, en arkitektur som syftar till att generera data som återspeglar de statiska egenskaperna i dess underliggande dataset utan att äventyra datasubjektens integritet. Trots forskningsfältet unga ålder har man gjort stora framsteg i genereringsprocessen av så kallad syntetisk data, och numera finns det modeller som kan generera bilder av hög realistisk karaktär. Som ett steg framåt i forskningen har arkitekturen adopterats till nya domäner, och den här studien syftar till att undersöka dess förmåga att syntatisera finansiell tabelldata. I studien undersöks en framträdande modell inom forskningsfältet, CTGAN, tillsammans med två föreslagna idéer i syfte att förbättra dess generativa förmåga. Resultaten indikerar att en förändrad träningsdynamik och en ny optimeringsstrategi förbättrar arkitekturens förmåga att generera syntetisk data. Den genererade datan håller i sin tur hög kvalité med tydliga influenser från dess underliggande dataset, och resultat på efterföljande analyser mellan datakällorna är av jämförbar karaktär. Slutsatsen är således att GANs har stor potential att generera tabulär data som kan betrakatas som substitut till känslig data, vilket möjliggör för en mer frikostig delningspolitik av data inom organisationer.
APA, Harvard, Vancouver, ISO, and other styles
47

Holm, Henrik. "Bidirectional Encoder Representations from Transformers (BERT) for Question Answering in the Telecom Domain. : Adapting a BERT-like language model to the telecom domain using the ELECTRA pre-training approach." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-301313.

Full text
Abstract:
The Natural Language Processing (NLP) research area has seen notable advancements in recent years, one being the ELECTRA model which improves the sample efficiency of BERT pre-training by introducing a discriminative pre-training approach. Most publicly available language models are trained on general-domain datasets. Thus, research is lacking for niche domains with domain-specific vocabulary. In this paper, the process of adapting a BERT-like model to the telecom domain is investigated. For efficiency in training the model, the ELECTRA approach is selected. For measuring target- domain performance, the Question Answering (QA) downstream task within the telecom domain is used. Three domain adaption approaches are considered: (1) continued pre- training on telecom-domain text starting from a general-domain checkpoint, (2) pre-training on telecom-domain text from scratch, and (3) pre-training from scratch on a combination of general-domain and telecom-domain text. Findings indicate that approach 1 is both inexpensive and effective, as target- domain performance increases are seen already after small amounts of training, while generalizability is retained. Approach 2 shows the highest performance on the target-domain QA task by a wide margin, albeit at the expense of generalizability. Approach 3 combines the benefits of the former two by achieving good performance on QA both in the general domain and the telecom domain. At the same time, it allows for a tokenization vocabulary well-suited for both domains. In conclusion, the suitability of a given domain adaption approach is shown to depend on the available data and computational budget. Results highlight the clear benefits of domain adaption, even when the QA task is learned through behavioral fine-tuning on a general-domain QA dataset due to insufficient amounts of labeled target-domain data being available.
Dubbelriktade språkmodeller som BERT har på senare år nått stora framgångar inom språkteknologiområdet. Flertalet vidareutvecklingar av BERT har tagits fram, bland andra ELECTRA, vars nyskapande diskriminativa träningsprocess förkortar träningstiden. Majoriteten av forskningen inom området utförs på data från den allmänna domänen. Med andra ord finns det utrymme för kunskapsbildning inom domäner med områdesspecifikt språk. I detta arbete utforskas metoder för att anpassa en dubbelriktad språkmodell till telekomdomänen. För att säkerställa hög effektivitet i förträningsstadiet används ELECTRA-modellen. Uppnådd prestanda i måldomänen mäts med hjälp av ett frågebesvaringsdataset för telekom-området. Tre metoder för domänanpassning undersöks: (1) fortsatt förträning på text från telekom-området av en modell förtränad på den allmänna domänen; (2) förträning från grunden på telekom-text; samt (3) förträning från grunden på en kombination av text från telekom-området och den allmänna domänen. Experimenten visar att metod 1 är både kostnadseffektiv och fördelaktig ur ett prestanda-perspektiv. Redan efter kort fortsatt förträning kan tydliga förbättringar inom frågebesvaring inom måldomänen urskiljas, samtidigt som generaliserbarhet kvarhålls. Tillvägagångssätt 2 uppvisar högst prestanda inom måldomänen, om än med markant sämre förmåga att generalisera. Metod 3 kombinerar fördelarna från de tidigare två metoderna genom hög prestanda dels inom måldomänen, dels inom den allmänna domänen. Samtidigt tillåter metoden användandet av ett tokenizer-vokabulär väl anpassat för båda domäner. Sammanfattningsvis bestäms en domänanpassningsmetods lämplighet av den respektive situationen och datan som tillhandahålls, samt de tillgängliga beräkningsresurserna. Resultaten påvisar de tydliga vinningar som domänanpassning kan ge upphov till, även då frågebesvaringsuppgiften lärs genom träning på ett dataset hämtat ur den allmänna domänen på grund av otillräckliga mängder frågebesvaringsdata inom måldomänen.
APA, Harvard, Vancouver, ISO, and other styles
48

Mejdi, Sami. "Encoder-Decoder Networks for Cloud Resource Consumption Forecasting." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-291546.

Full text
Abstract:
Excessive resource allocation in telecommunications networks can be prevented by forecasting the resource demand when dimensioning the networks and the allocation the necessary resources accordingly, which is an ongoing effort to achieve a more sustainable development. In this work, traffic data from cloud environments that host deployed virtualized network functions (VNFs) of an IP Multimedia Subsystem (IMS) has been collected along with the computational resource consumption of the VNFs. A supervised learning approach was adopted to address the forecasting problem by considering encoder-decoder networks. These networks were applied to forecast future resource consumption of the VNFs by regarding the problem as a time series forecasting problem, and recasting it as a sequence-to-sequence (seq2seq) problem. Different encoder-decoder network architectures were then utilized to forecast the resource consumption. The encoder-decoder networks were compared against a widely deployed classical time series forecasting model that served as a baseline model. The results show that while the considered encoder-decoder models failed to outperform the baseline model in overall Root Mean Squared Error (RMSE) and Mean Absolute Error (MAE), the forecasting capabilities were more resilient to degradation over time. This suggests that the encoder-decoder networks are more appropriate for long-term forecasting, which is an agreement with related literature. Furthermore, the encoder-decoder models achieved competitive performance when compared to the baseline, despite being treated with limited hyperparameter-tuning and the absence of more sophisticated functionality such as attention. This work has shown that there is indeed potential for deep learning applications in forecasting of cloud resource consumption.
Överflödig allokering av resurser I telekommunikationsnätverk kan förhindras genom att prognosera resursbehoven vid dimensionering av dessa nätverk. Detta görs i syfte att bidra till en mer hållbar utveckling. Inför detta prjekt har trafikdata från molnmiljön som hyser aktiva virtuella komponenter (VNFs) till ett IÅ Multimedia Subsystem (IMS) samlats in tillsammans med resursförbrukningen av dessa komponenter. Detta examensarbete avhandlar hur effektivt övervakad maskininlärning i form av encoder-decoder nätverk kan användas för att prognosera resursbehovet hos ovan nämnda VNFs. Encoder-decoder nätverken appliceras genom att betrakta den samlade datan som en tidsserie. Problemet med att förutspå utvecklingen av tidsserien formuleras sedan som ett sequence-2-sequence (seq2seq) problem. I detta arbete användes en samling encoder-decoder nätverk med olika arkitekturer för att prognosera resursförbrukningen och dessa jämfördes med en populär modell hämtad från klassisk tidsserieanalys. Resultaten visar att encoder-decoder nätverken misslyckades med att överträffa den klassiska tidsseriemodellen med avseende på Root Mean Squeared Error (RMSE) och Mean Absolut Error (MAE). Dock visar encoder-decoder nätverken en betydlig motståndskraft mot prestandaförfall över tid i jämförelse med den klassiska tidsseriemodellen. Detta indikerar att encoder-decoder nätverk är lämpliga för prognosering över en längre tidshorisont. Utöver detta visade encoder-decoder nätverken en konkurrenskraftig förmåga att förutspå det korrekta resursbehovet, trots en begränsad justering av disponeringsparametrarna och utan mer sofistikerad funktionalitet implementerad som exempelvis attention.
APA, Harvard, Vancouver, ISO, and other styles
49

Olausson, Erika. "Kan själv!? : -vad är verksamhetsnyttan för att själv skapaunderlaget för en Chatbot?" Thesis, Uppsala universitet, Informationssystem, 2018. http://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-353935.

Full text
Abstract:
Denna uppsats är uppbyggd på Design Science Research (DSR), där det inom denna studiestuderas den verksamhetsnytta som kan bli av att skapa en egen inlärd Chatbot. DesignScience Research är inom denna studie bron mellan skapandet och teoristudierna. Inomstudien skapas det en artefakt i form av en konceptuell modell, för att ge en framtida lösningför en modell som kan implementeras inom verksamheten. Att lära Chatboten automatisktfrån verksamhetens egna hemsida, har framgått som önskvärt. Artefakten har utvärderatsgenom dels ett experimentet med Natural Language Processing (NLP) paket och algoritmer,samt maskininlärningspaket och metoder. Den myndighet som studeras i denna studie ärRiksantikvarieämbete (RAÄ), där deras data har insamlats och behandlats med NLP ochmaskininlärning. Informationen som är insamlad i denna studie är cirka 70 % av RAÄsmaterial från hemsidan. Det som framkom från utvärderingen är att det krävs ett merdomänspecifikt corpus för att kunna skapa bättre klustrering av datat. Artefakten fråndesignen visade sig uppskattad utifrån att nyttan med inlärningen inte enbart skulle resultera ien Chatbot som fungerar för externa användare, utan även kan vara en hjälp för internaanvändare, som ett internt hjälpmedel för att söka av sin egen hemsida.
This essay is based on Design Science Research (DSR), in which it studies the businessbenefits that may be of creating a customized Chatbot. Design Science Research is within thisstudy the bridge between the creation and the theory studies. Within the study, an artifact iscreated in the form of a conceptual model, to provide a future solution for a model that can beimplemented within the business. Learning the chat boat automatically from the company'sown website has been shown as desirable. The artefact has been evaluated through anexperiment with Natural Language Processing (NLP) packages and algorithms, as well asmachine learning packages and methods. The authority studied in this study is theRiksantikvarieämbetet (RAÄ), where their data has been collected and processed with NLPand machine learning. The information collected in this study is approximately 70% ofRAÄ's material from the website. What emerged from the evaluation is that a moredomain-specific corpus is needed to create better clustering of data. The design from thedesign was estimated based on the fact that the benefit of learning would not only result in aChatbot that works for external users, but could also be a help for internal users, as aninternal tool for searching their own website.
APA, Harvard, Vancouver, ISO, and other styles
50

Hedman, Tobias, and Gustav Pettersson. "Hur påverkas kapitalförvaltning och finansiell rådgivning av Artificiell Intelligens? : En studie om de möjligheter dagens aktörer står inför." Thesis, Linköpings universitet, Företagsekonomi, 2018. http://urn.kb.se/resolve?urn=urn:nbn:se:liu:diva-148425.

Full text
Abstract:
Bakgrund: Artificiell Intelligens (AI) och maskininlärning implementeras i allt större grad på de finansiella marknaderna världen över. Syftet med implementeringen av AI inom finanssektorn innefattar bland annat kostnadsminimering, effektivisering, reducering av mänsklig bias samt ökning av intäkter för företagens verksamheter. Inom finansiell rådgivning och kapitalförvaltning finns brister gällande oberoende, kostnader, bias samt effektivisering varför det är relevant att undersöka hur dessa områden kan effektiviseras och förbättras med hjälp av AI. Vidare är det av intresse att undersöka hur människans roll kan komma att påverkas. Syfte: Syftet med denna studie är att analysera hur kapitalförvaltning och finansiell rådgivning kan påverkas av implementeringen av AI och hur synen på AI är inom dessa två områden. Metod: Studien är utformad utifrån en kvalitativ flerfallstudiedesign. Studiens empiriska material har samlats in från respondenter i två olika urvalsgrupper: kapitalförvaltare och finansiella rådgivare. Data har insamlats genom sju semistrukturerade intervjuer. Slutsats: Studiens resultat visar att AI har stor potential att reducera inslag av bias inom rådgivning och kapitalförvaltning. Styrkan i AI-lösningar återfinns i kombinationen av mänsklig intelligens och Artificiell Intelligens. Vidare står det klart att implementering av AI kan bidra till effektivare datahantering, kostnadshantering samt stordriftsfördelar. Implementeringen skapar möjligheter till ökad kundnytta samt en utökad kundgrupp. Vidare visar studiens resultat att AI har potential att minska intressekonflikter i form av Agency Theory. Slutligen visar studiens resultat att den framtida rådgivningen och kapitalförvaltningen sannolikt kommer ha inslag av cyborg finance, en samverkan mellan Artificiell Intelligens och mänsklig intelligens i form av hybridtjänster där de bästa egenskaperna från bådadera förenas. Nyckelord: Artificiell Intelligens, kapitalförvaltning, finansiell rådgivning, maskininlärning, djupinlärning, automatisering, psykologisk bias.
Background: Artificial Intelligence (AI) and machine learning are increasingly being implemented within the financial markets. The purpose of Artificial Iintelligence is to reduce costs, increase profits as well as efficiency and also reduce human bias. Within finacial advisory and asset management there are problems with independence, costs, bias and efficiency. Our study aims to analyse how these areas can be improved and become more efficient with AI. In addition, it is interesting to study what role the human is likely to take on as AI is increasingly being implemented. Aim: The purpose of this study is to analyse how AI can affect asset management and financial advisory, and also to study the public opinion of this transformation. Methodology:  This study has been designed by a qualitative research strategy. The empirical data derives from two different respondent groups: asset management and financial advisory. The data has been collected through seven semi-structured interviews.                                                                                                                                                  Conclusion: The result of this study indicates that AI has the potential to reduce biases within financial advisory and asset management. The strength of AI-solutions lies in the combination between Artificial Intelligence and human intelligence. Furthermore, an implementation of AI contributes to a higher efficiency when it comes to data handling, cost efficiency as well as economies of scale. This creates opportunities to reach a higher customer benefit and a wider customer group. Moreover, the study indicates that AI has the potential of reducing conflicts of interest and agency problems. Lastly, this study indicates that the future of financial advisory and asset management is likely to consist of cyborg finance. In other words, cooperation between Artificial Intelligence and human intelligence is likely to become commonplace, in the shape of hybrid services where the best attributes of humans and AI work together. Keywords: Artificial Intelligence, asset management, financial advisory, machine learning, deep learning, automation, psychological bias
APA, Harvard, Vancouver, ISO, and other styles
We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!

To the bibliography