Academic literature on the topic 'Data Scraping'
Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles
Consult the lists of relevant articles, books, theses, conference reports, and other scholarly sources on the topic 'Data Scraping.'
Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.
You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.
Journal articles on the topic "Data Scraping"
Khder, Moaiad. "Web Scraping or Web Crawling: State of Art, Techniques, Approaches and Application." International Journal of Advances in Soft Computing and its Applications 13, no. 3 (November 28, 2021): 145–68. http://dx.doi.org/10.15849/ijasca.211128.11.
Full textPadghan, Sameer, Satish Chigle, and Rahul Handoo. "Web Scraping-Data Extraction Using Java Application and Visual Basics Macros." Journal of Advances and Scholarly Researches in Allied Education 15, no. 2 (April 1, 2018): 691–95. http://dx.doi.org/10.29070/15/56996.
Full textScassa, Teresa. "Ownership and control over publicly accessible platform data." Online Information Review 43, no. 6 (October 14, 2019): 986–1002. http://dx.doi.org/10.1108/oir-02-2018-0053.
Full textMaślankowski, Jacek. "The collection and analysis of the data on job advertisements with the use of big data." Wiadomości Statystyczne. The Polish Statistician 64, no. 9 (September 30, 2019): 60–74. http://dx.doi.org/10.5604/01.3001.0013.7590.
Full textWang, Yuguang, Dengyun Zhu, Bin Zhang, Qi Guo, Fucheng Wan, and Ning Ma. "Review of data scraping and data mining research." Journal of Physics: Conference Series 1982, no. 1 (July 1, 2021): 012161. http://dx.doi.org/10.1088/1742-6596/1982/1/012161.
Full textMaulana, Afrizal Aziz, Ajib Susanto, and Desi Purwanti Kusumaningrum. "Rancang Bangun Web Scraping Pada Marketplace di Indonesia." JOINS (Journal of Information System) 4, no. 1 (July 1, 2019): 41–53. http://dx.doi.org/10.33633/joins.v4i1.2544.
Full textSpeckmann, Felix. "Web Scraping." Zeitschrift für Psychologie 229, no. 4 (December 2021): 241–44. http://dx.doi.org/10.1027/2151-2604/a000470.
Full textKrotov, Vlad, and Matthew Tennyson. "Research Note: Scraping Financial Data from the Web Using the R Language." Journal of Emerging Technologies in Accounting 15, no. 1 (February 1, 2018): 169–81. http://dx.doi.org/10.2308/jeta-52063.
Full textRao, M. Kameswara, Rohit Lagisetty, M. S. V. K. Maniraj, K. N. S. Dattu, and B. Sneha Ganga. "Commodity Price Data Analysis Using Web Scraping." International Journal of Advances in Applied Sciences 4, no. 4 (December 1, 2015): 146. http://dx.doi.org/10.11591/ijaas.v4.i4.pp146-150.
Full textGallagher, John R., and Aaron Beveridge. "Project-Oriented Web Scraping in Technical Communication Research." Journal of Business and Technical Communication 36, no. 2 (December 13, 2021): 231–50. http://dx.doi.org/10.1177/10506519211064619.
Full textDissertations / Theses on the topic "Data Scraping"
Carle, Victor. "Web Scraping using Machine Learning." Thesis, KTH, Skolan för elektroteknik och datavetenskap (EECS), 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-281344.
Full textDen här rapporten undersöker vad som krävs för att skapa en robust webbskrapare, designad för att kontinuerligt kunna skrapa en specifik hemsida trots att den underliggande HTML-koden förändras. En algoritm presenteras som är lämplig för hemsidor med en repetitiv HTML-struktur. En repetitiv HTML struktur innebär ofta att det visas saker såsom nyhetsartiklar, videos, böcker och så vidare. Det innebär att samma HTML-kod återanvänds ett flertal gånger, då det enda som skiljer de här sakerna åt är exempelvis deras titlar. Ett bra exempel är hemsidan Youtube. Skraparen funkar genom att använda textklassificering av ord som finns i HTML-koden, på så sätt kan maskinlärningsalgoritmen, support vector machine, känna igen den kod som omger datan som är eftersökt på hemsidan. För att möjliggöra detta så förvandlas HTML-koden, samt relevant metadata, till vektorer med hjälp av bag-of-words-modellen. Efter omvandlingen kan vektorerna matas in i maskinlärnings-modellen och klassifiera datan. Algoritmen testas på äldre versioner utav hemsidan tagna från ett webarkiv för att förhoppningsvis få en bra bild utav vad framtida prestationer skulle kunna vara. Algoritmen uppnår varierande resultat baserat på en stor mängd variabler inom hemsidan samt de äldre versionerna av hemsidorna. Algoritmen presterade bäst på Yahoo news där den uppnådde 90 % träffsäkerhet på äldre sidor.
Färholt, Fredric. "Less Detectable Web Scraping Techniques." Thesis, Linnéuniversitetet, Institutionen för datavetenskap och medieteknik (DM), 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:lnu:diva-104887.
Full textWebbskrapning är ett effektivt sätt att hämta data på, det har även blivit en aktivitet som är enkel att genomföra och chansen att en lyckas är hög. Användare behöver inte längre vara fantaster inom teknik när de skrapar data, det finns idag mängder olika och lättanvändliga plattformstjänster. Den här studien utför experi- ment för att se hur personer kan skrapa på ett oupptäckbart sätt med ett populärt och intelligent JavaScript bibliotek (Puppeteer). Tre webbskrapningsalgoritmer, där två av dem använder rörelsemönster från riktiga webbanvändare, demonstrerar hur en kan samla information. Webbskrapningsalgoritmerna har körts på en hemsida som ingått i experimentet med kännbar säkerhet, honeypot, och aktivitetsloggning, nå- got som gjort det möjligt att samla och utvärdera data från både algoritmerna och hemsidan. Resultatet visar att det kan vara möljligt att skrapa på ett oupptäckbart sätt genom att använda Puppeteer. En av algoritmerna avslöjar även möjligheten att kontrollera prestanda genom att använda inbyggda metoder i Puppeteer.
Legaspi, Ramos Xurxo. "Scraping Dynamic Websites for Economical Data : A Framework Approach." Thesis, Linnéuniversitetet, Institutionen för datavetenskap (DV), 2016. http://urn.kb.se/resolve?urn=urn:nbn:se:lnu:diva-57070.
Full textOucif, Kadday. "Evaluation of web scraping methods : Different automation approaches regarding web scraping using desktop tools." Thesis, KTH, Data- och elektroteknik, 2016. http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-188418.
Full textEn hel del information kan bli funnen och extraherad i olika format från den semantiska webben med hjälp av webbskrapning, med många tekniker som uppkommit med tiden. Den här rapporten är skriven med målet att utvärdera olika webbskrapnings metoder för att i sin tur utveckla en automatiserad, prestandasäker, enkelt implementerad och solid extraheringsprocess. Ett antal parametrar är definierade för att utvärdera och jämföra befintliga webbskrapningstekniker. En matris av skrivbords verktyg är utforskade och två är valda för utvärdering. Utvärderingen inkluderar också tillvägagångssättet till att lära sig sätta upp olika webbskrapnings processer med så kallade agenter. Ett nummer av länkar blir skrapade efter data med och utan exekvering av JavaScript från webbsidorna. Prototyper med de utvalda teknikerna testas och presenteras med webbskrapningsverktyget Content Grabber som slutlig lösning. Resultatet utav det hela är en bättre förståelse kring ämnet samt en prisvärd extraheringsprocess bestående utav blandade tekniker och metoder, där en god vetskap kring webbsidornas uppbyggnad underlättar datainsamlingen. Sammanfattningsvis presenteras och diskuteras resultatet med hänsyn till valda parametrar.
Rodrigues, Lanny Anthony, and Srujan Kumar Polepally. "Creating Financial Database for Education and Research: Using WEB SCRAPING Technique." Thesis, Högskolan Dalarna, Mikrodataanalys, 2020. http://urn.kb.se/resolve?urn=urn:nbn:se:du-36010.
Full textCosman, Vadim, and Kailash Chowdary. "End user interface for collecting and evaluating company data : Real-time data collection through web-scraping." Thesis, Högskolan Dalarna, Institutionen för information och teknik, 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:du-37740.
Full textCeccaroni, Giacomo. "Raccolta di dati eterogenei e multi-sorgente per data visualization dei rapporti internazionali dell'Ateneo di Bologna." Master's thesis, Alma Mater Studiorum - Università di Bologna, 2017. http://amslaurea.unibo.it/13940/.
Full textFranchini, Giulia. "Associazioni non profit e linked open data: un esperimento." Bachelor's thesis, Alma Mater Studiorum - Università di Bologna, 2015. http://amslaurea.unibo.it/8350/.
Full textHolm, Andreas, and Oscar Ahlm. "Skrapa Facebook : En kartläggning över hur data kan samlas in från Facebook." Thesis, Malmö universitet, Institutionen för datavetenskap och medieteknik (DVMT), 2021. http://urn.kb.se/resolve?urn=urn:nbn:se:mau:diva-43326.
Full textA vast amount of data is shared daily on social media platforms. Data that if it can becollected and sorted can prove valueable as a basis for research work. Especially in countrieswhere social media constitutes the only possible place for citizens to make their voicesheard. Facebook is one of the most frequently used social media platforms and thus can bea potential rich source from which data can be collected. But Facebook has become morerestrictive about who gets access to the data on their platform. This has created an interestin ways how to get access to the data that is shared on Facebooks platform without gettingexplicit approval from Facebook. At the same time it creates questions about the ethicsand the legality of it. This work intended to investigate different aspects, such as technical,ethical, legal, related to the collecting of data from Facebooks platform by performing aliterary review and experiments. The literary review showed that it was difficult to findmaterial regarding technical measures taken by Facebook to prevent web scraping. Theexperiments that were performed identified some of these measures, among others thatthe structure of the HTML code changes and that ids of HTML elements updates whendifferent events occur on the web page, which makes web scraping increasingly difficult.The literary review also showed that it is troublesome to know which data is legal to scrapefrom Facebook and which is not. This is partly due to the fact that different countries havedifferent laws to which one must conform when scraping web data, and partly that it canbe difficult to know what counts as personal data and thus is protected by GDPR amongother laws.
Mascellaro, Maria Maddalena. "Integrazione di sorgenti eterogenee per un sistema di Data Visualization." Bachelor's thesis, Alma Mater Studiorum - Università di Bologna, 2018. http://amslaurea.unibo.it/16818/.
Full textBooks on the topic "Data Scraping"
vanden Broucke, Seppe, and Bart Baesens. Practical Web Scraping for Data Science. Berkeley, CA: Apress, 2018. http://dx.doi.org/10.1007/978-1-4842-3582-9.
Full textMacDonald, Allyson, ed. Web Scraping with Python: Collecting More Data from the Modern Web. 2nd ed. Beijing: O’Reilly Media, 2018.
Find full textPython Web Scraping: Hands-on data scraping and crawling using PyQT, Selnium, HTML and Python. Packt Publishing, 2017.
Find full textWeb Scraping with Python: Collecting Data from the Modern Web. O’Reilly Media, 2015.
Find full textBroucke, Seppe vanden. Practical Web Scraping for Data Science: Best Practices and Examples with Python. Apress, 2018.
Find full textAutomated Data Collection with R: A Practical Guide to Web Scraping and Text Mining. Wiley, 2015.
Find full textWeb Scraping with Python: Successfully scrape data from any website with the power of Python. Packt Publishing, 2015.
Find full textPython Automation Cookbook: 75 Python Automation Ideas for Web Scraping, Data Wrangling, and Processing Excel, Reports, Emails, and More, 2nd Edition. Packt Publishing, Limited, 2020.
Find full textOliva Abarca, Jesús Eduardo. Cultura y Big Data. Métodos y técnicas para el análisis cultural en una sociedad datificada. Ediciones Comunicación Científica, 2021. http://dx.doi.org/10.52501/cc.014.
Full textBélair-Gagnon, Valérie, and Nikki Usher, eds. Journalism Research That Matters. Oxford University Press, 2021. http://dx.doi.org/10.1093/oso/9780197538470.001.0001.
Full textBook chapters on the topic "Data Scraping"
Boehmke, Bradley C. "Scraping Data." In Use R!, 129–62. Cham: Springer International Publishing, 2016. http://dx.doi.org/10.1007/978-3-319-45599-0_16.
Full textBressoud, Thomas, and David White. "Web Scraping." In Introduction to Data Systems, 681–714. Cham: Springer International Publishing, 2020. http://dx.doi.org/10.1007/978-3-030-54371-6_22.
Full textZhao, Bo. "Web Scraping." In Encyclopedia of Big Data, 1–3. Cham: Springer International Publishing, 2017. http://dx.doi.org/10.1007/978-3-319-32001-4_483-1.
Full textZhao, Bo. "Web Scraping." In Encyclopedia of Big Data, 951–53. Cham: Springer International Publishing, 2022. http://dx.doi.org/10.1007/978-3-319-32010-6_483.
Full textEgger, Roman, Markus Kroner, and Andreas Stöckl. "Web Scraping." In Applied Data Science in Tourism, 67–82. Cham: Springer International Publishing, 2022. http://dx.doi.org/10.1007/978-3-030-88389-8_5.
Full textPatel, Jay M. "Introduction to Web Scraping." In Getting Structured Data from the Internet, 1–30. Berkeley, CA: Apress, 2020. http://dx.doi.org/10.1007/978-1-4842-6576-5_1.
Full textNolan, Deborah, and Duncan Temple Lang. "Scraping Data from HTML Forms." In Use R!, 315–38. New York, NY: Springer New York, 2013. http://dx.doi.org/10.1007/978-1-4614-7900-0_9.
Full textvanden Broucke, Seppe, and Bart Baesens. "From Web Scraping to Web Crawling." In Practical Web Scraping for Data Science, 155–72. Berkeley, CA: Apress, 2018. http://dx.doi.org/10.1007/978-1-4842-3582-9_6.
Full textvanden Broucke, Seppe, and Bart Baesens. "Introduction." In Practical Web Scraping for Data Science, 3–23. Berkeley, CA: Apress, 2018. http://dx.doi.org/10.1007/978-1-4842-3582-9_1.
Full textvanden Broucke, Seppe, and Bart Baesens. "The Web Speaks HTTP." In Practical Web Scraping for Data Science, 25–48. Berkeley, CA: Apress, 2018. http://dx.doi.org/10.1007/978-1-4842-3582-9_2.
Full textConference papers on the topic "Data Scraping"
Beno, Miloslav, Jakub Misek, and Filip Zavoral. "AgentMat: Framework for data scraping and semantization." In 2009 Third International Conference on Research Challenges in Information Science (RCIS). IEEE, 2009. http://dx.doi.org/10.1109/rcis.2009.5089286.
Full textThomas, David Mathew, and Sandeep Mathur. "Data Analysis by Web Scraping using Python." In 2019 3rd International conference on Electronics, Communication and Aerospace Technology (ICECA). IEEE, 2019. http://dx.doi.org/10.1109/iceca.2019.8822022.
Full textDiouf, Rabiyatou, Edouard Ngor Sarr, Ousmane Sall, Babiga Birregah, Mamadou Bousso, and Seny Ndiaye Mbaye. "Web Scraping: State-of-the-Art and Areas of Application." In 2019 IEEE International Conference on Big Data (Big Data). IEEE, 2019. http://dx.doi.org/10.1109/bigdata47090.2019.9005594.
Full text"A SEMANTIC SCRAPING MODEL FOR WEB RESOURCES - Applying Linked Data to Web Page Screen Scraping." In 3rd International Conference on Agents and Artificial Intelligence. SciTePress - Science and and Technology Publications, 2011. http://dx.doi.org/10.5220/0003185704510456.
Full textChaulagain, Ram Sharan, Santosh Pandey, Sadhu Ram Basnet, and Subarna Shakya. "Cloud Based Web Scraping for Big Data Applications." In 2017 IEEE International Conference on Smart Cloud (SmartCloud). IEEE, 2017. http://dx.doi.org/10.1109/smartcloud.2017.28.
Full textPRATIBA, D., ABHAY M.S., AKHIL DUA, Giridhar K. SHANBHAG, NEEL BHANDARI, and UTKARSH SINGH. "Web Scraping And Data Acquisition Using Google Scholar." In 2018 3rd International Conference on Computational Systems and Information Technology for Sustainable Solutions (CSITSS). IEEE, 2018. http://dx.doi.org/10.1109/csitss.2018.8768777.
Full textErtam, Fatih. "Deep learning based text classification with Web Scraping methods." In 2018 International Conference on Artificial Intelligence and Data Processing (IDAP). IEEE, 2018. http://dx.doi.org/10.1109/idap.2018.8620790.
Full textYou, Jaebeom, Jaekyu Lee, and Hyuk-Yoon Kwon. "A Complete and Fast Scraping Method for Collecting Tweets." In 2021 IEEE International Conference on Big Data and Smart Computing (BigComp). IEEE, 2021. http://dx.doi.org/10.1109/bigcomp51126.2021.00014.
Full textPark, Andrew J., Ruhi Naaz Quadari, and Herbert H. Tsang. "Phishing website detection framework through web scraping and data mining." In 2017 8th IEEE Annual Information Technology, Electronics and Mobile Communication Conference (IEMCON). IEEE, 2017. http://dx.doi.org/10.1109/iemcon.2017.8117212.
Full textFatmasari, Yesi Novaria Kunang, and Susan Dian Purnamasari. "Web Scraping Techniques to Collect Weather Data in South Sumatera." In 2018 International Conference on Electrical Engineering and Computer Science (ICECOS). IEEE, 2018. http://dx.doi.org/10.1109/icecos.2018.8605202.
Full text