Dissertations / Theses on the topic 'Logistisk regression'
Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles
Consult the top 50 dissertations / theses for your research on the topic 'Logistisk regression.'
Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.
You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.
Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.
Widman, Linnea. "Regression då data utgörs av urval av ranger." Thesis, Umeå universitet, Institutionen för matematik och matematisk statistik, 2012. http://urn.kb.se/resolve?urn=urn:nbn:se:umu:diva-60664.
Full textAlpine skiers measure their performance in FIS ranking. We will investigate some methods on how to analyze data where response data is based on ranks like this. In situations where response data is based on ranks there is no obvious method of analysis. Here, we examine differences in the use of linear, logistic and ordinal logistic regression to analyze data of this type. Bootstrap is used to make confidence intervals. For our data these methods give similar results when it comes to finding important explanatory variables. Based on this survey we cannot see any reason why one should use the more advanced models.
Klockare, Mikael. "Logit, oddskvot och sannolikhet : En analys av multinomial logistisk regression." Thesis, Karlstads universitet, Avdelningen för nationalekonomi och statistik, 2019. http://urn.kb.se/resolve?urn=urn:nbn:se:kau:diva-74575.
Full textThis thesis starts by studying the multinomial logistic regression and its moments and how the results are measured. The theory begins with the binomial logistics regression and gradually moves on towards the multinomial logistics regression. Concepts as logit, odds ratio and probabilities are explained, the effects of the independent variables discussed and the link to ordinary linear regression is illustrated. There will also be a deeper, mathematical look at the function of logistic growth. Thereafter the multinomial logistic regression model will be applied. The model is useful within several domains and this thesis lies within sportsanalytics. For this thesis matchstatistics from ice hockey, that is Örebro Hockey’s matches from season 2012/13 to 2017/18, has been used and the final model has three exploratory variables. The outcome of the result performs equivalent to other methods, which applies categorical data analysis within sportsanalytics.
Olsson, Henrik. "Upphandling av måltidsverksamhet inom äldreomsorgen : En logistisk regressionsanalys." Thesis, Uppsala universitet, Statistiska institutionen, 2015. http://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-275733.
Full textMarklund, Per. "Alpin permafrost i Kebnekaisefjällen : Modellering med logistisk regression och BTS-data." Thesis, Uppsala universitet, Luft-, vatten och landskapslära, 2011. http://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-174485.
Full textThis study presents an attempt to model the limits of mountain permafrost distribution within the Kebnekaise massif in northern Sweden. A map showing the probabilities for the mountain permafrost distribution has been created using statistical modelling through logistic regression of Bottom Temperature of Snow cover (BTS) measurements. The survey was conducted in March to April 2011 with a total of 56 BTS-point measurements stretching from 1073 to 1805 m.a.s.l. Permafrost occurrence was determined to be a function of altitude. This was determined by a stepwise selection analysis, a method used for identifying parameters with a statistical significance against a dependent variable. The other parameters that were tested for significance were the slope and aspect of the topography, and the potential incoming solar radiation. Although these might have an influence on the permafrost occurrence, they were considered to be of less importance and were thus neglected in the modelling. The model indicates permafrost with greater than 0,8 probability at and above 1190 m.a.s.l, and with probability from 0,8 to 0,5 between 1190 to 1144 m.a.s.l. Since the survey was carried in the Tarfala valley, the result of the modelling is more uncertain in the parts of the area which lie outside of this valley.
Vesterlund, Sebastian, and Jens Svensson. "Illusionen om frihet : Det nya arbetslivet och dess fängslande egenskaper." Thesis, Södertörns högskola, Institutionen för samhällsvetenskaper, 2012. http://urn.kb.se/resolve?urn=urn:nbn:se:sh:diva-18157.
Full textThe purpose of this paper is to explore how different aspects of working life affect the individual. Our starting point in this paper is that we are critical of jobs with high autonomy that is becoming increasingly common. To assist us, we have a lot of previous research as well as critical theory and Foucault’s theory about power and surveillance that guides us through the research process. The selection is based on previous statistics produced by the ESS, which consists of a collaboration between 24 European countries. The essay test different aspects of paid work and its affect on work-life balance. The results show that the higher the degree of autonomy the individual has in his/her work, the less dissatisfied he/she is with time spent between work and leisure. A higher degree of autonomy does in fact lead to the individual worrying about work-related problems in his/her leisure time. Our conclusion is that there are good reasons to pay attention to what this increasingly common tendency can affect the individual.
Alic, Almedina, and Caroline Emilsson. "Att modellera utfallen i en fotbollsmatch: med multinomial respektive ordinal logistisk regression." Thesis, KTH, Matematisk statistik, 2016. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-188983.
Full textThis study examines how well multinomial and ordinal logistic regressions predict the outcome of football games. The two models have been used for comparison, since the multinomial logistic model treats the outcome as nominal while the ordinal model treats the outcome as ordered variables, 1 > X > 2. The outcome of the game is affected by quantitative explanatory variables, based on data from Premier League 2015/2016, which describe the teams form and performance. The multinomial model has a prediction measure of 53.4 % and the ordinal model has a prediction measure of 43.8 %. Furthermore, most of the explanatory variables have small and unexpected influence. The conclusion is that modeling with solely historical data is a good basis, but can be improved. In future research the number of observations should be increased and the model should be tested on data different from the one used to develop the model. Furthermore, the goal difference could be used as the response variable, to examine if the prediction measure improves. The mathematical study is completed with an industrial management approach, which consists of an analysis of the betting industry with Porters Five Forces and suggestions of establishment strategies with focus on marketing. Because of the Swedish gambling monopoly, the competition from local operators is limited, but foreign network operators increase their market shares. A new foreign network operator must thus use digital distribution channels to reach the Swedish betting market. The Swedish consumer is price sensitive, why transaction marketing with focus on 4P, above all price, is preferable towards these.
Altersved, Sofia, and Elin Mäkelä. "Vaccinering mot H1N1 : En studie av vad som påverkade svenska individers vaccinationsbeslut 2009." Thesis, Karlstads universitet, Fakulteten för ekonomi, kommunikation och IT, 2012. http://urn.kb.se/resolve?urn=urn:nbn:se:kau:diva-14512.
Full textSvininfluensan (H1N1) bröt ut 2009 och spred sig snabbt över flera länder i världen med utveckling till en pandemi, vilket utgjorde ett stort hot mot människors hälsa. Det konstaterades snart att H1N1 var av en annan karaktär än säsongsinfluensan, då den framförallt drabbade yngre individer och konsekvenserna av sjukdomen förväntades vara allvarligare. I Sverige beslutades att befolkningen skulle erbjudas en kostnadsfri vaccinering och den svenska vaccinationstäckningsgraden blev relativt hög i jämförelse med många andra länder. Denna uppsats undersöker vilka faktorer som påverkade svenska befolkningens beslut om vaccinering mot svininfluensan under 2009. Detta görs genom en statistisk undersökning i form av en logistisk regressionsanalys som utförs på sekundärdata. Resultaten visar att sannolikheten för vaccinering mot H1N1 ökar om individen är över 60 år, samt ökar med en stigande inkomst. Resultaten visar också att kvinnor har högre benägenhet att vaccinera sig än män. Däremot förekommer inget samband mellan hälsonivå eller utbildning och vaccinering mot H1N1. Då resultaten inte var helt konsistenta i jämförelse med teorier och tidigare studier, kan konstateras att det är svårt att fastställa hur olika faktorer påverkade individers vaccinationsbeslut mot H1N1. Möjligtvis kan detta bero på de särskilda och extrema omständigheter som rörde H1N1. Utifrån detta kan det bli svårt att förutse hur individer kommer resonera och agera inför eventuella framtida pandemier.
Strandqvist, Ida, and Louise Yxenholt. "Informell äldreomsorg : En studie om vad som påverkar svenska individens informella omsorgsgivande av äldre närstående." Thesis, Karlstads universitet, Handelshögskolan, 2014. http://urn.kb.se/resolve?urn=urn:nbn:se:kau:diva-32446.
Full textFormal care refers to public health and social care interventions that usually municipal, county or private sector company on contract performs. Informal care includes care provided by relatives that corresponds action when long-term assistance is needed and volunteer efforts involving unpaid duties that they themselves choose to do. This paper examines whether the variables gender, age, education, employment, income, place of residence and children in the home may be associated with Swedish individuals performing informal care by parents or in-laws. The result shows that if you have a high level of education the probability of performing informal care for their parents / in-laws decreases. Something that also reduces the probability is if you have more than one child under 18 at home, which can be seen as logical since children require much time. Something that instead increases the probability of performing informal care is if you are employed or if you are aged 31-80 years. The survey also shows that gender matters since it appeared that more women performing informal care. The results are not entirely consistent with previous theories and concepts, which enables us to conclude that it is difficult to determine how various factors affect the informal care.
Alnervik, Jonna, and Andersson Peter Nord. "En retrospektiv studie av vilka patientgrupper som erhåller insulinpump." Thesis, Linköping University, Statistics, 2010. http://urn.kb.se/resolve?urn=urn:nbn:se:liu:diva-59044.
Full textMålsättning
Att utreda skillnader i tillgänglighet till insulinpump mellan olika patientgrupper samt vad som orsakar ett byte till insulinpump.
Metod
Data från 7224 individer med typ 1 diabetes vid tio olika vårdenheter analyserades för att utreda effekterna av njurfunktion, kön, långtidsblodsocker, insulindos, diabetesduration samt ålder. Jämförelsen mellan patientgrupper utfördes med logistisk regression som en tvärsnittsstudie och Cox-regression för att utreda vad som föregått ett byte till pump.
Resultat
Genom logistisk regression erhölls en bild av hur skillnader mellan patienter som använder insulinpump och patienter som inte gör det ser ut i dagsläget. Cox-regressionen tar med ett tidsperspektiv och ger på så sätt svar på vad som föregått ett byte till insulinpump. Dessa analyser gav liknande resultat gällande variabler konstanta över tiden. Kvinnor använder pump i större utsträckning än män och andelen pumpanvändare skiljer sig åt vid olika vårdenheter. I dagsläget visar sig hög ålder sänka sannolikheten att använda insulinpump, vilket bekräftas vid den tidsberoende studien som visade hur sannolikheten att byta till pump är avsevärt lägre vid hög ålder. Långtidsblodsockret har också tydlig effekt på sannolikheten att gå över till pump där ett högt långtidsblodsocker medför hög sannolikhet att byta till insulinpump.
Slutsatser
I dagsläget finns det skillnader i andelen insulinpumpanvändare mellan olika patientgrupper och skillnader finns även i de olika gruppernas benägenhet att byta från andra insulinbehandlingar till insulinpump. Beroende av patienters njurfunktion, kön, långtidsblodsocker, insulindos, diabetesduration och ålder har dessa olika sannolikheter att byta till insulinpump.
Alm, Micael. "Probability Modelling of Alpine Permafrost Distribution in Tarfala Valley, Sweden." Thesis, Uppsala universitet, Luft-, vatten och landskapslära, 2017. http://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-323971.
Full textA field data collection has been carried out in Tarfala valley at the turn of March to April 2017. The collection resulted in 36 BTS-measurements (Bottom Temperature of Snow cover) that has been used in combination with data from earlier surveys, to create a model of the occurrence of permafrost around Tarfala. To identify meaningful parameters that permafrost relies on, independent variables were tested against BTS in a stepwise regression. The independent variables elevation, aspect, solar radiation, slope angle and curvature were produced for each investigated BTS-point in a geographic information system. The stepwise regression selected elevation as the only significant variable, elevation was applied to a logistic regression to model the permafrost occurrence. The final model showed that the probability of permafrost increases with height. To distinguish between continuous, discontinuous and sporadic permafrost, the model was divided into three zones with intervals of probability. The continuous permafrost is the highest located zone and therefore has the highest likelihood, this zone delimits the discontinuous permafrost at 1523 m a.s.l. The discontinuous permafrost has probabilities between 50-80 % and its lower limit at 1108 m a.s.l. separates the discontinuous zone from the sporadic permafrost.
Lindberg, Lars, and Carolin Dahlberg. "Konkursprognostisering i en svensk kontext : En modell utvecklad för svenska småföretag." Thesis, Umeå universitet, Företagsekonomi, 2014. http://urn.kb.se/resolve?urn=urn:nbn:se:umu:diva-90721.
Full textBylund, Rebecca, and Höök Malin J-son. "Går det prediktera demens? : En jämförande studie mellan Logistisk regression, Elastic Net och Random Forests." Thesis, Umeå universitet, Statistik, 2018. http://urn.kb.se/resolve?urn=urn:nbn:se:umu:diva-149728.
Full textBjörk, Gustaf, and Carlsson Tobias. "Klassificeringsmetoder med medicinska tillämpningar : En jämförande studie mellan logistisk regression, elastic net och random forest." Thesis, Umeå universitet, Statistik, 2016. http://urn.kb.se/resolve?urn=urn:nbn:se:umu:diva-122698.
Full textHedström, Jon, and Johan Vidlund. "Modellerande av förhållande mellan P/E-tal och nedgångar på OMXS30." Thesis, Linköpings universitet, Matematisk statistik, 2014. http://urn.kb.se/resolve?urn=urn:nbn:se:liu:diva-114068.
Full textAlfredsson, Lovisa. "Attityder till invandring och invandrare : En kvantitativ uppsats om individens utbildningsnivå och arbetssituations samband med attityder till invandring och invandrare." Thesis, Stockholms universitet, Sociologiska institutionen, 2015. http://urn.kb.se/resolve?urn=urn:nbn:se:su:diva-111783.
Full textLarsson, Märta, and Linnea Lantz. "Lärares trivsel med sin skolledning : En studie om förklaringsfaktorer till lärares trivsel med skolledningen." Thesis, Uppsala universitet, Statistiska institutionen, 2017. http://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-315047.
Full textGiron, Eriksson Cecilia, and Haglund Daniella Fröberg. "Varför hjälpa andra? : - En enkätstudie om motivationen bakom socionomers val av yrke." Thesis, Uppsala universitet, Sociologiska institutionen, 2016. http://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-297198.
Full textLjungberg, Amanda, and Ahn Agnieszka von. "Finns det ett samband mellan födelseland och patientrapporterade utfall och upplevelser av vården efter stroke? : Jämförelse av statistiska metoder för att hantera skillnader i patientsammansättning." Thesis, Umeå universitet, Statistik, 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:umu:diva-184934.
Full textLamers, Petrus, and Linda Sagnérius. "Prognostiska faktorer för att inte fullfölja multimodal smärtrehabilitering." Thesis, Högskolan Dalarna, Vårdvetenskap, 2019. http://urn.kb.se/resolve?urn=urn:nbn:se:du-30665.
Full textBackground: Prolonged pain is common and causes great suffering. Multimodal rehabilitation (MMR) is a treatment method that is offered to patients with complex rehabilitation needs. Treatment adherence is defined how well the patient's behavior is consistent with the recommendations the patient has agreed with his / her health care provider and is of importance for the treatment outcome. Little is known today about prognostic factors for treatment adherence at MMR. Identification of obstacles that can explain why patients do not complete treatment is therefore important in order to be able to optimize the treatment effects. Purpose: To investigate which factors were important for the prognosis to not completing MMR 2 treatment in patients with complex long-term pain. Method: The project was a prospective cohort study. Study population were patients aged 18–67 years with long-term pain who started an MMR 2 program between 2009–2016, registered in the National Register for Pain Rehabilitation (NRS). Thirty-six variables were available, the outcome measure was to complete or not complete MMR. To identify variables with the greatest importance for treatment adherence, regression models were created with logistic regression. The model's discriminatory ability was tested, and goodness of fit was assessed Results: The three most important factors that increased odds of not completing MMR were high MPI-PI, patients in the younger age category and low motivation. The model's discriminatory ability was substandard, goodness of fit was not significant. Conclusion: The model cannot predict outcomes on individual level but provides information on which factors historically have been important. In the long term, identification of factors that impair adherence can contribute to adapting MMR programs and thereby create better conditions so that several patients complete the rehabilitation.
Blomkvist, Oscar. "Machine Learning Based Sentiment Classification of Text, with Application to Equity Research Reports." Thesis, KTH, Matematisk statistik, 2019. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-257506.
Full textI denna rapport analyserar vi sentimentet, eller attityden, i aktieanalysrapporter skrivna av analytiker på Skandinaviska Enskilda Banken (SEB). Etablerade statistiska metoder och maskininlärningsmetoder för klassificering av sentimentet i textdokument som antingen positivt eller negativt presenteras. Vi är speciellt intresserade av en typ av rekurrent neuronnät känt som long short-term memory (LSTM). Vidare undersöker vi två olika scheman för att märka upp träningsdatan som genereras från rapporterna. Riktmärken för klassificeringsgraden erhålls med hjälp av logistisk regression. Slutligen implementeras två olika ordrepresentationsmodeller och dubbelriktad LSTM av varierande nätverksstorlek, och jämförs med riktmärkena. Vi finner att logistisk regression presterar bra för ett av märkningsschemana, och att LSTM har något bättre prestanda.
Kullerback, Karl, and Marcus Löf. "Återköp av aktier på den svenska marknaden : Hur påverkar utestående optioner sannolikheten för aktieåterköp?" Thesis, Uppsala University, Department of Economics, 2009. http://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-120164.
Full textI mars år 2000 blev det tillåtet för börsnoterade bolag att genomföra återköp av egna aktier i Sverige. En del kritiker hävdar att återköp kan användas till att påverka aktiekursen positivt, till förmån för bland annat optionsinnehavare. I denna uppsats har vi undersökt om antal utestående optioner till anställda ökar sannolikheten för genomförandet av aktieåterköp. För att ta reda på detta har vi undersökt data från samtliga bolag som var noterade på NASDAQ OMX Large Cap i Stockholm vid utgången av år 2007. Vi har analyserat datamaterialet med hjälp av enkel linjär regression samt logistisk regression. Vi finner en svag positiv korrelation i den enkla regressionsmodellen. Den logistiska regressionen påvisar dock ett starkare samband, vilket indikerar att återköp till viss del kan påverkas av bolagens optionsprogram.
Eriksson, Ulf, and Fredrik Källgren. "Nyckeltal och finansiell kris : En studie av bioteknikbranschen." Thesis, Uppsala University, Department of Business Studies, 2008. http://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-8894.
Full textTidigare forskning har genom att studera alla tillgängliga företag eller företag med
udda branscher exkluderade identifierat vissa nyckeltal som bra indikatorer på
finansiell kris. I denna studie undersöks om dessa nyckeltal även ger ett
samstämmigt resultat för en udda bransch. Med utgångspunkt från
bioteknikbranschen identifieras genom logistisk regression nyckeltalen korta skulder
genom eget kapital och avkastning på investerat kapital som indikatorer på finansiell kris.
Avkastning på investerat kapital överensstämmer med tidigare resultat, medan korta
skulder genom eget kapital bör, för denna bransch, tolkas tvärt emot jämfört med
tidigare studier.
Löfving, Jimmy, and Brännström Robin Carrión. "Vilka grupper av faktorer predicerar bäst elevers skolkande? : En kvantitativ studie baserad på PISA-enkäten 2015." Thesis, Uppsala universitet, Statistiska institutionen, 2017. http://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-323697.
Full textJansson, Nils-Henrik, and Patrik Pavlov. "Cryptosporidiumutbrottet i Östersunds kommun 2010 : Påverkan på kommunens barn." Thesis, Linköpings universitet, Statistik, 2013. http://urn.kb.se/resolve?urn=urn:nbn:se:liu:diva-95525.
Full textThe purpose of this study is to analyze how children under the age of 15 years were affected by the 2010 Östersund Cryptosporidium outbreak. The data consists of responses to a questionnaire from 514 children concerning their health related to the outbreak. The questionnaire was developed by the Swedish Institute for Infectious Disease Control shortly after the outbreak. The analysis of risk factors and the analysis of symptoms associated with infection were performed using logistic regression models based on both a Bayesian and a frequentist approach. Using the two different approaches we thus consider the dataset from different angels and at the same time try to identify the differences between these two approaches. Another part of the paper presents estimates calibrated for nonresponse of the number of Cryptosporidium infections both totally and on a monthly basis. Additionally estimates of the prevalence of cases in various domain groups are presented. Finally, associations between the symptoms are investigated using logistic regression. With the same goal we performed variable clustering of the symptoms using the fuzzy clustering approach. The results shows that higher water intake, getting water thru the municipal water distribution system, Former loose stools and Gender could be identified as risk factors while the best-explanatory symptoms were watery diarrhea, abdominal or stomach pain, fever and tiredness/exhaustion.
Elmdahl, Martin, and Jonas Tärnemark. "En webbundersökning med panel : Vilka variabler påverkar om, hur tidigt och vad panelmedlemmar svarar?" Thesis, Linköpings universitet, Statistik, 2014. http://urn.kb.se/resolve?urn=urn:nbn:se:liu:diva-103695.
Full textThis report gives a background description of the data collection company Norstat and how they implement a tracking survey with a panel via the internet. Furthermore connections between variables describing persons in the survey and the way these persons answer the survey will be investigated. The report also intends to find out how long a survey needs to be running and if there are differences between received answers depending on when a person has answered. A detailed description of the processing and variables included in the data material being used will also be given. Earlier research concerning panels and web surveys are covered to give the reader a nuanced picture of the pros and cons with opinion surveys. Logistic regression methods have been used to examine which variables influence whether a person will answer the survey or not, and the variables that make a person answer the survey early or late. Other methods used are descriptive statistics and a χ2-test. The results show that factors influencing how much spare time a person has give the greatest impact on whether and how early the survey gets completed. It can be noted that it is often enough with a field period up to 6 days after the invitation to the survey has been sent out until all categories of persons are relatively equally represented. The optimal field period differs depending on whether a study is aimed at providing a picture of the entire country's population or only specific categories of this. For a special category of the persons, it can sometimes be enough to let the field period run until the day after the invitation to the survey had been sent out for enough answers to be submitted.
Hardin, Patrik, and Sam Tabari. "Modelling Non-life Insurance Policyholder Price Sensitivity : A Statistical Analysis Performed with Logistic Regression." Thesis, KTH, Matematisk statistik, 2017. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-209773.
Full textDetta kandidatexamensarbete inom matematisk statistik undersöker möjligheten att modellera förnyelsegraden för kommersiella skadeförsärkringskunder. Arbetet utfördes i samarbete med If Skadeförsäkring vid huvudkontoret i Stockholm, Sverige. Uppsatsen innehåller en introduktion till underliggande koncept inom försäkring och matematik samt en utförlig översikt över projektets analytiska process, följt av en diskussion och slutsatser. De huvudsakliga delarna av projektet var insamling och bearbetning av förklarande försäkringsdata samt utvecklandet och tolkningen av en logistisk regressionsmodell för förnyelsegrad. En första modell byggdes och moderna metoder inom matematik och statistik utfördes för att erhålla en slutgiltig regressionsmodell uppbyggd av 9 signifikanta kundkaraktäristika. Regressionsmodellen hade en förklaringsgrad av 61% vilket pekar på att det till en viss grad är möjligt att förklara förnyelsegraden hos försäkringskunder utifrån dessa karaktäristika. Resultaten från den slutgiltiga modellen översattes slutligen till ett priskänslighetsmått vilket möjliggjorde implementering i prissättningsmodeller samt CRM-system. Vi anser att priskänslighetsanalys, om korrekt genomfört, är ett naturligt steg i utvecklingen av dagens prissättningsmodeller inom försäkringsbranschen och detta projekt lägger en grund för fortsatta studier inom detta område.
Cronstedt, Axel, and Rebecca Andersson. "Readjusting Historical Credit Ratings : using Ordered Logistic Regression and Principal ComponentAnalysis." Thesis, Umeå universitet, Institutionen för matematik och matematisk statistik, 2018. http://urn.kb.se/resolve?urn=urn:nbn:se:umu:diva-148567.
Full textJustering av historiska kreditbetyg med hjälp av ordinal logistiskregression och principialkomponentsanalys När Basel II implementerades introducerades även nya riktlinjer för finan-siella instituts riskhantering och beräkning av kreditrisk, så som möjlighetenför banker att använda interna beräkningar av Probability of Default (PD),Exposure at Default (EAD) och Loss Given Default (LGD), som tillsammansgrundar sig i varje låntagares sannoliket för fallissemang. Dessa tre mått ut-gör grunden för beräkningen av de kapitaltäckningskrav som banker förväntasuppfylla och baseras i sin tur på bankernas interna kreditratingsystem. Detär därmed av stor vikt för banker att bygga stabila kreditratingmodeller medkapacitet att generera pålitliga beräkningar av motparternas kreditrisk. Dessamodeller är vanligtvis baserade på empirisk data och modellens goodness-of-fit,eller passning till datat, beror till stor del på kvalitén och den statistiska sig-nifikansen hos det data som står till förfogande. Därför är en av de viktigasteaspekterna för kreditratingsmodeller att ha tillräckligt många observationeratt träna modellen på, vilket gör modellens utvecklingsskede samt mängdendata avgörande för modellens framgång.Huvudsyftet med detta projekt är att, på ett enkelt och effektivt sätt, skapaen längre, homogen tidsserie genom att justera historisk kreditratingdata i enportfölj med företagslån tillhandahållen av Svenska Handelsbanken AB. Jus-teringen görs genom att utveckla olika ordinala logistiska regressionsmodellermed beroende variabler bestående av makroekonomiska variabler, på olikasätt. En av modellerna använder makroekonomiska variabler i form av princi-palkomponenter skapade med hjälp av en principialkomponentsanalys, medande andra modelelrna använder de makroekonomiska variablerna enskilt i olikakombinationer. Modellerna testas för att utvärdera både deras förmåga attjustera portföljens historiska kreditratings samt för att göra prediktioner.
Apelthun, Catharina. "Klassificeringsförmåga vid komplett cytogenetisk respons för patienter med kronisk myeloisk leukemi : En komparativ studie mellan metoderna diskriminantanalys och logistisk regression." Thesis, Uppsala universitet, Statistik, 2016. http://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-295760.
Full textAnderskär, Erika, and Frida Thomasson. "Inkrementell responsanalys av Scandnavian Airlines medlemmar : Vilka kunder ska väljas vid riktad marknadsföring?" Thesis, Linköpings universitet, Statistik och maskininlärning, 2017. http://urn.kb.se/resolve?urn=urn:nbn:se:liu:diva-139465.
Full textEwertzh, Jacob. "Bankruptcy Distributions and Modelling for Swedish Companies Using Logistic Regression." Thesis, KTH, Matematisk statistik, 2019. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-252329.
Full textDen här uppsatsen avhandlar konceptet konkurs, för svenska företag. Den faktiska konkursfördelningen över tid analyseras, både på en sammanlagd nivå och inom olika industrier. Flera modeller konstrueras i syfte att bäst beskriva konkursfördelningen. Huvudsakligen är logistiska regressions modeller utformade för detta syfte, men andra typer av modeller är inkluderade i analysen. Några av dessa modeller är skapade för jämförelse, men också för att kunna producera en så exakt modell som möjligt. Ett stort data set med nästan 30 miljoner kvartalsvisa observationer används i analysen. Mikro- och makroekonomiska faktorer är inkluderade i detta data set. De framtagna modellerna omfattar olika tidsperioder mellan 1990–2018, tar in olika faktorer i analysen och visar på olika nivåer av noggrannhet. Modellen som har högst förklaringsgrad är en logistisk regressionsmodell som tar hänsyn till både mikro- och makroekonomiska faktorer. Denna modell analyseras både i och utanför sitt samplingsintervall, och visar på goda resultat i båda områdena. Modellen är först skattad på en delmängd av tidsperioden, för att kunna jämföra den förutspådda fördelningen med en faktisk fördelning. Sedan är en ekvivalent modell skattad på hela intervallet, för att bäst möjligt förutspå framtida scenarion. För detta syfte är Logistiska regressionsmodellen kombinerad med Vektor Autoregressiva (VAR)-modeller som förutspår makroekonomiska faktorer, och empiriska regressionsmodeller som förutspår mikroekonomiska faktorer. Alla tre modelltyper används för att kunna beskriva det mest sannolika scenariot, samt de värsta tänkbara scenariona. Från de värsta tänkbara scenariona kan riskmått, så som empiriska Value at Risk, tas fram. All analys producerar resultat och de viktigaste sammanställs. Dessa är att den logistiska regression modell som tar hänsyn till makroekonomiska faktorer ger bra resultat både i och utanför samplingsintervallet. Vidare är de framtida simulerade resultaten svårare att tolka, men den genomförda analysen har argument för exakthet i förutsägelserna. Därmed presenteras ett troligt framtida scenario med fortsatt låg konkurs frekvens inom det närmaste året.
Pettersson, Anders. "High-Dimensional Classification Models with Applications to Email Targeting." Thesis, KTH, Matematisk statistik, 2015. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-168203.
Full textFöretag kan använda e-mejl för att på ett enkelt sätt sprida viktig information, göra reklam för nya produkter eller erbjudanden och mycket mer, men för många e-mejl kan göra att kunder slutar intressera sig för innehållet, genererar badwill och omöjliggöra framtida kommunikation. Att kunna urskilja vilka kunder som är intresserade av det specifika innehållet skulle vara en möjlighet att signifikant förbättra ett företags användning av e-mejl som kommunikationskanal. Denna studie fokuserar på att urskilja kunder med hjälp av statistisk inlärning applicerad på historisk data tillhandahållen av musikstreaming-företaget Spotify. En binärklassificeringsmodell valdes, där responsvariabeln beskrev huruvida kunden öppnade e-mejlet eller inte. Två olika metoder användes för att försöka identifiera de kunder som troligtvis skulle öppna e-mejlen, logistisk regression, både med och utan regularisering, samt random forest klassificerare, tack vare deras förmåga att hantera högdimensionella data. Metoderna blev sedan utvärderade på både ett träningsset och ett testset, med hjälp av flera olika statistiska valideringsmetoder så som korsvalidering och ROC kurvor. Modellerna studerades under både scenarios med stora stickprov och högdimensionella data. Där scenarion med högdimensionella data representeras av att antalet observationer, N, är av liknande storlek som antalet förklarande variabler, p, och scenarion med stora stickprov representeras av att N ≫ p. Lasso-baserad variabelselektion utfördes för båda dessa scenarion för att studera informationsvärdet av förklaringsvariablerna. Denna studie visar att det är möjligt att signifikant förbättra öppningsfrekvensen av e-mejl genom att selektera kunder, även när man endast använder små mängder av data. Resultaten visar att en enorm ökning i antalet träningsobservationer endast kommer förbättra modellernas förmåga att urskilja kunder marginellt.
Johansson, Henrik, and Mathias Kardell. "Demografisk sammansättning samt beteende hos medlemmar i panel." Thesis, Linköping University, Linköping University, Statistics, 2010. http://urn.kb.se/resolve?urn=urn:nbn:se:liu:diva-57244.
Full textThe use of marketing research panels are a more and more frequently used source of information for studies within many different branches. The purpose of this report is to investigate the demographic composition of panels and compare it with the population of Sweden, a possible change in behaviour of respondents, and if the source of recruitment is the cause of possible differences in study results. The study was commissioned by Norstats Linkoping office. Sources for the data material include Norstat’s recruitment process and their two main panels with different recruitment sources. To enable a deeper investigation of behaviour we also constructed a survey that was sent to 2,714 members of Norstat’s internet panels.
The statistical analysis includes contingency table analysis, multiple logistic regression, and Poisson regression. The results show that the demographic composition does not fully cover all the aspects of the Swedish population and some groups are less represented than others. The behaviour tends to differ between panel members that have responded to three or less surveys compared to members that have responded to twenty or more surveys. Source of recruitment does not seem to affect the results of studies, but it has some effect on the demographic composition of marketing research panels.
Användandet av paneler som källa vid undersökningar har den senaste tiden blivit en allt vanligare företeelse. Denna rapport har för avsikt att undersöka panelers demografiska sammansättning och överensstämmande med Sveriges befolkning, eventuell ändring av svarsbeteende samt huruvida rekryteringskällan ger upphov till kvalitetsskillnader hos medlemmar i en panel. Företaget Norstat har med sitt kontor i Linköping figurerat som uppdragsgivare till arbetet. Datamaterialet till studien har uppkommit från Norstats rekryteringsprocess samt från företagets två huvudpaneler med olika rekryteringskällor. För att djupare undersöka svarsbeteende konstruerade vi även en enkätundersökning som skickades ut till 2 714 medlemmar i Norstats internetpaneler.
Den statiska analysen innefattar χ2-test, multipel logistisk regression samt Poissonregression. Resultaten påvisade att den demografiska sammansättningen i panelen inte fullt ut speglade Sveriges befolkning samt att vissa grupper undertäcks i högre utsträckning än andra. Svarsbeteendet hos medlemmar i paneler har en tendens att ändras från det att medlemmen har svarat på en till tre undersökningar, till det att den har svarat på tjugo undersökningar eller fler. Rekryteringskällan till en panel verkar inte ge upphov till några större skillnader i svarsresultat, men däremot finns vissa skillnader i demografisk sammansättning.
Åkesson, Lisa, and Denise Henningsson. "Klassificering av köp på betalda sökannonser." Thesis, Linköpings universitet, Statistik, 2016. http://urn.kb.se/resolve?urn=urn:nbn:se:liu:diva-129412.
Full textThe data consultancy company Knowit AB has a client who advertises on Google AdWords. This thesis focuses mainly on finding which settings in AdWords generate purchases of the client’s product. If a setting frequently contributes to clicks but rarely to purchases of the product, the setting is not profitable.The target variable in this thesis is binary and indicates whether a click on the advertisement led to purchase of the product or not. Since the target variable’s distribution was skewed, the sampling technique SMOTE was used to create more observations in the minority class. The classification methods researched and presented in this thesis are logistic regression, neural networks and decision trees.The results showed that all four factor had significant affect on the probability of purchase. First, if a desktop or laptop computer was used to search on Google, the likelihood that a click leads to purchase is substantially higher compared to if a mobile or tablet was used. Second, an “exact match” setting for the keywords gives the highest probability of purchase and a “broad match” gives the lowest probability. Third, purchase rates are also affected by the day of the week. Sunday has the highest probability of purchase while Saturday and Tuesday have the lowest probability. Finally, an advertisement´s average position affects the likelihood of the product being purchased. The higher value of average position, the higher the likelihood of purchase.
Jovanovic, Filip, and Paul Singh. "Modelling default probabilities: The classical vs. machine learning approach." Thesis, KTH, Matematisk statistik, 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-273570.
Full textFintechbolag som erbjuder Köp Nu, Betala Senare-tjänster är starkt beroende av välfungerande fallissemangmodeller. Detta då dessa fintechbolag bär risken av att kunder inte betalar tillbaka sina krediter. För att minimera förlusterna som uppkommer när en kund inte betalar tillbaka finns flera olika maskininlärningsalgoritmer att applicera, men i dagens explosiva utveckling på maskininlärningsfronten finns det ett stort antal algoritmer att välja mellan. Denna avhandling ämnar att testa tre olika maskininlärningsalgoritmer för att fastställa vilken av dessa som presterar bäst sett till olika prestationsmått så som ROCAUC och precision-recall AUC. Algoritmerna som jämförs är Logistisk Regression, Random Forest och CatBoost. Samtliga algoritmers prestanda jämförs även med Klarnas nuvarande XGBoost-modell. Resultaten visar på att CatBoost-modellen är den mest optimala sett till det primära prestationsmåttet ROCAUC. CatBoost-modellen var överlägset bättre med sju procentenheter högre ROCAUC än Logistisk Regression, tre procentenheter högre ROCAUC än Random Forest och en procentenhet högre ROCAUC än Klarnas nuvarande XGBoost-modell
Barr, Kajsa, and Hampus Pettersson. "Predicting and Explaining Customer Churn for an Audio/e-book Subscription Service using Statistical Analysis and Machine Learning." Thesis, KTH, Matematisk statistik, 2019. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-252723.
Full textDet pågående teknologiskiftet har bidragit till en ökad konsumtion av digital media och underhållning via olika typer av mobila enheter, t.ex. smarttelefoner. Storytel är ett företag som erbjuder en prenumerationstjänst för ljud- och e-böcker och har haft en kraftig tillväxt de senaste åren. När företag befinner sig i en konkurrensutsatt marknad är det av stor vikt att förstå sig på kunders beteende samt vilka krav och önskemål kunder har på tjänsten. Det har nämligen visat sig vara mer lönsamt att behålla existerande kunder i tjänsten än hela tiden värva nya, och det är därför viktigt att se till att en befintlig kund inte avslutar sin prenumeration. Ett sätt att hantera detta är genom att använda statistisk analys och maskininlärningsmetoder för att identifiera mönster och beteenden i data. I denna uppsats används både logistisk regression och random forest med syfte att både prediktera och förklara uppsägning av tjänsten i ett tidigt stadie av en kunds prenumeration. Modellerna testas tillsammans med variabelselektionsmetoderna Elastic Net, RFE och PCA, samt tillsammans med översamplingsmetoden SMOTE. Resultatet blev att random forest tillsammans med RFE bäst predikterade uppsägning av tjänsten med 0.2427 i måttet precision och 0.7699 i måttet recall. Ett annat viktigt resultat är att den förklarande modellen ges av logistisk regression tillsammans med Elastic Net, där signifikanta estimat av regressionskoefficienterna ökar förklaringsgraden för beteenden och mönster relaterade till kunders uppsägning av tjänsten. Därmed ges användbara insikter ur ett företagsperspektiv.
Sjöblom, Feliks. "Effects of COVID-19 on temporal urban diversity : A quantitative study using mobile phone data as a proxy for human mobility patterns." Thesis, Uppsala universitet, Kulturgeografiska institutionen, 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-439997.
Full textPeco, Amina. "Misskötta studielån : Hur mycket förväntas de kosta?" Thesis, Linnéuniversitetet, Institutionen för nationalekonomi och statistik (NS), 2016. http://urn.kb.se/resolve?urn=urn:nbn:se:lnu:diva-59675.
Full textHögström, Fredrik. "Socialt kapital och politiskt deltagande." Thesis, Stockholms universitet, Sociologiska institutionen, 2012. http://urn.kb.se/resolve?urn=urn:nbn:se:su:diva-77267.
Full textWestin, Emil, and Christoffer Eriksson. "Tycker vi likadant? : Skillnaden mellan kommunpolitikers och väljares inställning till flyktingfrågan 2012 i Sverige." Thesis, Uppsala universitet, Statistiska institutionen, 2018. http://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-353085.
Full textFritjofsson, Hugo. "Social klass – Ett begrepp i behov av revidering? : Är idén om ’arbetslogik’ samt utbildningskrav fruktsamma för att skapa ett yrkesbaserat klasschema?" Thesis, Stockholms universitet, Sociologiska institutionen, 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:su:diva-194095.
Full textKornfeld, Sarah. "Predicting Default Probability in Credit Risk using Machine Learning Algorithms." Thesis, KTH, Matematisk statistik, 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-275656.
Full textDenna uppsats har undersökt internt utvecklade modeller för att estimera sannolikheten för utebliven betalning (PD) inom kreditrisk. Samtidigt som nya regelverk sätter restriktioner på metoder för modellering av kreditrisk och i viss mån hämmar utvecklingen av riskmätning, utvecklas samtidigt mer avancerade metoder inom maskinlärning för riskmätning. Således har avvägningen mellan strängare regelverk av internt utvecklade modeller och framsteg i dataanalys undersökts genom jämförelse av modellprestanda för referens metoden logistisk regression för uppskattning av PD med maskininlärningsteknikerna beslutsträd, Random Forest, Gradient Boosting och artificiella neurala nätverk (ANN). Dataunderlaget kommer från SEB och består utav 45 variabler och 24 635 observationer. När maskininlärningsteknikerna blir mer komplexa för att gynna förbättrad prestanda är det ofta på bekostnad av modellens tolkbarhet. En undersökande analys gjordes därför med målet att mäta förklarningsvariablers betydelse i maskininlärningsteknikerna. Resultaten från den undersökande analysen kommer att jämföras med resultat från etablerade metoder som mäter variabelsignifikans. Resultatet av studien visar att den logistiska regressionen presterade bättre än maskininlärningsteknikerna baserat på prestandamåttet AUC som mätte 0.906. Resultatet from den undersökande analysen för förklarningsvariablers betydelse ökade tolkbarheten för maskininlärningsteknikerna. Resultatet blev även validerat med utkomsten av de etablerade metoderna för att mäta variabelsignifikans.
Bäck, Eneroth Moa. "An analysis of customer retention using data mining." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2018. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-235709.
Full textDetta examensarbete hade som målsättning att svara på frågan huruvida användandet av tredje-parts-applikationer, utöver användandet av originalprodukten, har en inverkan på kundlojalitet hos ett företag som arbetar med att hantera digitala rättigheter. Studien utgick ifrån nollhypotesen att det inte finns en relationen mellan den beroende variabeln kundlojalitet och den oberoende variabeln användandet av tredje-parts-applikationer. För att kunna utvärdera huruvida hypotesen kan förkastas eller inte, analyseras relationen mellan detvå variablerna med hjälp av logistisk regression. Resultatet visade att att det fanns en positiv inverkan för valt dataset. Följaktligen var slutsatsen att det potentiellt skulle kunna finnas en positiv korrelation mellan de två variablerna och nollhypotesen kunde därför förkastas.
SUNDQVIST, ALYCIA. "A company’s ability Not to default on a loan : Does the location have an impact?" Thesis, KTH, Skolan för industriell teknik och management (ITM), 2018. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-239901.
Full textDenna masteruppsats syftar till att svara på frågan om typen av region eller kategori av kommun ett företag är belägen i, påverkar företagets förmåga att inte återbetala ett lån. Tidigare forskning används för att finna vilka faktorer som påverkar företagets överlevnad i fem nivåer: Makro, Industri, Regional, Företag och Individnivå. Den data som används kommer från ett finansiellt företag som erbjuder småföretag kreditprodukter och har därmed bidragit med lånedata. En statistisk analys har gjorts och den använda metoden är en logistisk regression, där den beroende variabeln är om bolaget har kunnat återbetala på sitt lån eller ej. Slutsatserna som kan dras är att i linje med tidigare forskning där företagets ålder, antal anställda och kapital haft ett positivt inverkan på ett företags sannolikhet att kunna återbetala ett lån. Dessutom har de regionala faktorerna påverkan på företags förmåga att kunna återbetala ett lån där företag i pendlingsregionerna har större återbetalningsförmåga.
Palmquist, Jacob. "How to identify downturns within an office submarke : A quantitative time series analysis of Stockholm CBD." Thesis, KTH, Fastigheter och byggande, 2018. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-230936.
Full textUnder de senaste åren har det skett en betydande ökning av efterfrågan på attraktiva kontorslokaler i Stockholm vilket resulterat i rekordlåga direktavkastningskrav inom Stockholm Central Business District (CBD), vilket indikerar på varningssignaler avseende en överhettad delmarknad. Eftersom fastighetsmarknaden är avgörande för ekonomin som helhet är det viktigt att förbättra förståelsen och förutsägbarheten för framtida fastighetscykler. Denna studie producerade tre olika logistiska regressionsmodeller med syfte att identifiera nedgångar i kontorsmarknaden inom Stockholm CBD. Den mest framgångsrika modellen kunde förutse 74 % av de faktiska nedgångarna som inträffade under 114 observerade kvartal mellan Q3 1989 och Q4 2017. Den beroende nedgångsvariabeln består av prime yield som förklaras av variabler på nationell basis i kombination med delmarknadsspecifika variabler. En annan producerad modell innehöll variabler avseende förtroende och förväntningar hos hyresgäster i Stockholm. Denna modell var dock otillfredsställande, vilket ledde till att denna studie föreslog ytterligare forskning om fluktuationer i efterfrågan relaterade till de nuvarande egenskaperna hos Stockholms centralbank
Singh, Gurpreet. "Statistical Modeling of Dynamic Risk in Security Systems." Thesis, KTH, Matematisk statistik, 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-273599.
Full textBig data har använts regelbundet inom ekonomi för att bygga prognosmodeller, det är dock ett relativt nytt koncept inom säkerhetsbranschen. Denna studie förutsäger vilka larmkoder som kommer att låta under de kommande 7 dagarna på plats $L$ genom att observera de senaste 7 dagarna. Logistisk regression och neurala nätverk används för att lösa detta problem. Eftersom att problemet är av en multi-label natur tillämpas logistisk regression i kombination med binary relevance och classifier chains. Modellerna tränas på data som har annoterats med två separata metoder. Den första metoden annoterar datan genom att endast observera plats $L$ och den andra metoden betraktar $L$ och $L$:s omgivning. Eftersom problemet är multi-labeled kommer annoteringen sannolikt att vara obalanserad och därför används resamplings metoden, SMOTE, och random over-sampling för att öka frekvensen av minority labels. Recall, precision och F1-score mättes för att utvärdera modellerna. Resultaten visar att den andra annoterings metoden presterade bättre för alla modeller och att classifier chains och binary relevance presterade likartat. Binary relevance och classifier chains modellerna som tränades på datan som använts sig av resamplings metoden SMOTE gav ett högre macro average F1-score, dock sjönk prestationen för neurala nätverk. Resamplings metoden SMOTE presterade även bättre än random over-sampling. Neurala nätverksmodellen överträffade de andra två modellerna på alla metoder och uppnådde högsta F1-score.
Rynell, Daniel. "Sambandet mellan fysisk aktivitet och psykiskt välbefinnande i ett urval av den svenska befolkningen: resultat från levnadsnivåundersökningen 2000." Thesis, Stockholms universitet, 2011. http://urn.kb.se/resolve?urn=urn:nbn:se:su:diva-58689.
Full textFjällström, Peter. "Prediktion av vårdrelaterade sjukdomar i Västerbotten." Thesis, Umeå universitet, Institutionen för matematik och matematisk statistik, 2017. http://urn.kb.se/resolve?urn=urn:nbn:se:umu:diva-141550.
Full textFaraj, Dina. "Using Machine Learning for Predictive Maintenance in Modern Ground-Based Radar Systems." Thesis, KTH, Matematisk statistik, 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-299634.
Full textMilitära system är ofta en del av kritiska operationer där oplanerade driftstopp bör undvikas till varje pris. Med hjälp av moderna maskininlärningsalgoritmer kan det vara möjligt att förutsäga när och var ett fel kommer att inträffa. Detta möjliggör tid för beställning av reservdelar och schemaläggning av underhåll. Denna uppsats är en konceptstudie för detektion av anomalier i övervakningsdata från ett markbaserat radarsystem som ett initialt experiment för att studera prediktivt underhåll. Datat som används i detta arbete kommer från en Saab Giraffe 4A radar under normal operativ drift, dvs. ingen avvikande data med kända brister tillhandahölls. Problemställningen är ursprungligen ett oövervakat maskininlärningsproblem eftersom datat saknar etiketter. Spekulativa binära etiketter introduceras (uppstart och stabil fas) för att uppskatta klassificeringsnoggrannhet. Systemet fungerar korrekt i båda faserna men övervakningsdatat ser annorlunda ut. Genom att visa att de två faserna kan urskiljas, kan man anta att avvikande data också går att detektera när fel uppstår. Tre olika klassificeringsmetoder dvs. två oövervakade maskininlärningmodeller, K-means klustring och isolation forest samt en övervakad modell, logistisk regression utvärderas utifrån deras förmåga att upptäcka uppstartfasen varje gång systemet slås på. Metoderna utvärderas grafiskt och baserat på deras träffsäkerhet. Alla tre metoderna känner igen en startfas för minst fyra av sju delsystem. Genom att endast analysera deras noggrannhetspoäng, överträffar logistisk regression de andra modellerna. De insamlade resultaten demonstrerar möjligheten att skilja mellan uppstartfas och stabil fas, både i en övervakad och oövervakad miljö. För att välja den bästa metoden är det nödvändigt med ytterligare experiment på större datamängder.
Adolfsson, Chandra, and Alexandra Håkansson. "En studie av sambandet mellan kvarstående bias och kostnad vid selektiv granskning i undersökningen Kortperiodisk Sysselsättningsstatistik : Analys av parameterval i verktyget Selekt." Thesis, Örebro University, Swedish Business School at Örebro University, 2009. http://urn.kb.se/resolve?urn=urn:nbn:se:oru:diva-9585.
Full textDet har pågått ett intensivt utvecklingsarbete på Statistiska Centralbyrån (SCB) under de senaste åren i syfte att standardisera och effektivisera statistikproduktionsprocessen. I detta utvecklingsarbete har fokus främst riktats mot processerna insamling och granskning. Ett flertal studier har visat att det finns potential att reducera granskningens omfattning samtidigt som den övergripande kvaliteten i undersökningarna bibehålls. För att uppnå detta krävs att nya arbetssätt, metoder och verktyg utvecklas och implementeras.
Den traditionella ansatsen på SCB har varit att i granskningsprocessen försöka hitta och rätta alla databearbetnings- och mätfel. Ingen skillnad har gjorts mellan stora och små fel eller om felen har någon effekt på statistiken eller inte. Detta är en ineffektiv ansats där stora resurser åtgår till att rätta fel som inte påverkar den statistiska redovisningen nämnvärt. I mer moderna ansatser betonas vikten av att hitta betydelsefulla fel som har stor påverkan på parameterskattningarna och att fel som inte ger någon påverkan bör lämnas som de är eller åtgärdas via imputering. Detta, att inte granska allt, kallas för selektiv granskning.
SCB har beslutat att införa metoden selektiv granskning med poängfunktioner. Metoden fordrar att poängberäkningar görs, dessa utförs i verktyget Selekt. Verktyget ingår i den framtida verktygslådan för granskning som är under utveckling vid SCB och är uppbyggt av ett stort antal parametrar. För att uppnå så effektiv granskning som möjligt måste de mest lämpliga parametervärdena sökas för att sedan implementeras i Selekt.
I denna studie har ett datamaterial från undersökningen Kortperiodisk Sysselsättningsstatistik, privat sektor (KSP) använts för att studera sambanden mellan statistikens kvalitet och valet av parametrar i Selekt. Valet av datamaterial motiveras främst av att Selekt ska implementeras i KSP under år 2010. De parametrar som har behandlats i studien kallas för KAPPA, TAU och LAMBDA samt variablerna RPB_20 och Kostnad.
Logistisk regression har använts för att undersöka vilken påverkan parametrarna har på den bias (kallad RPB) som införs i skattningarna vid selektiv granskning. En ansats valdes där sambandet mellan responsvariabeln RPB_20 och förklaringsvariablerna KAPPA, TAU och Kostnad studerades separat för olika värden på LAMBDA.
Vid resultatframställningen indikerades tidigt att valet av värde på LAMBDA inte verkade ha någon nämnvärd betydelse för modellen och i de fortsatta analyserna stärktes denna misstanke och kom att omfatta även KAPPA och TAU. Det var redan från början känt att Kostnad är en viktig variabel att ta hänsyn till och för att undersöka detta närmare konstruerades en modell bestående av ett fjärdegradspolynom med enbart variabeln Kostnad. Modellen lyckades fånga upp huvuddragen av variationen i RPB_20.
Det går inte att dra generella slutsatser från den studie som här har genomförts. Resultaten visar dock att en modell utan KAPPA, TAU och LAMBDA fungerar för att beskriva variationen i RPB_20. Valet av värden på KAPPA, TAU och LAMBDA i Selekt är av mindre betydelse. I implementeringsarbetet av Selekt i KSP rekommenderas därför att, förutom RPB, fokusera på variabeln Kostnad för att hitta den mest lämpliga kombinationen av parameterinställningar.
Strandendahl, Louise, and Jarl Emilie Löfgren. "Psykisk hälsa som klassmarkör : En kvantitativ studie av socioekonomisk klassposition och schizofreni." Thesis, Stockholms universitet, Sociologiska institutionen, 2015. http://urn.kb.se/resolve?urn=urn:nbn:se:su:diva-112074.
Full text