Efficient processing of large-scale spatio-temporal data

Titel: Efficient processing of large-scale spatio-temporal data
verantwortlich: Hagedorn, Stefan (VerfasserIn); Sattler, Kai-Uwe (AkademischeR BetreuerIn); Seeger, Bernhard (AkademischeR BetreuerIn); Gertz, Michael (AkademischeR BetreuerIn); Technische Universität Ilmenau (Grad-verleihende Institution)
Hochschulschriftenvermerk: Dissertation, Technische Universität Ilmenau, 2020
veröffentlicht: Ilmenau: , [2020?]
Erscheinungsjahr: 2020
Erscheint auch als: Hagedorn, Stefan, 1985 - , Efficient processing of large-scale spatio-temporal data, Ilmenau : Universitätsbibliothek, 2020, 1 Online-Ressource (148 Seiten)
Medientyp: Buch Hochschulschrift
Datenquelle: K10plus Verbundkatalog
Tags: Tag hinzufügen

Zugang

Weitere Informationen sehen Sie, wenn Sie angemeldet sind. Noch keinen Account? Jetzt registrieren.

Andere Ausgaben

Hagedorn, Stefan, 1985 - , Efficient processing of large-scale spatio-temporal data, Ilmenau : Universitätsbibliothek, 2020, 1 Online-Ressource (148 Seiten)


LEADER	05397cam a2200541 4500
001	183-1698141351
003	DE-627
005	20230406123903.0
007	tu
008	200513s2020 gw \|\|\|\|\| m 00\| \|\|eng c
035			\|a (DE-627)1698141351
035			\|a (DE-599)KXP1698141351
035			\|a (OCoLC)1375078280
040			\|a DE-627 \|b ger \|c DE-627 \|e rda
041			\|a eng
044			\|c XA-DE-TH
084			\|a 54.64 \|2 bkl
100	1		\|a Hagedorn, Stefan \|d 1985- \|e VerfasserIn \|0 (DE-588)1206215402 \|0 (DE-627)169200672X \|4 aut
245	1	0	\|a Efficient processing of large-scale spatio-temporal data \|c vorgelegt von Dipl.-Inf. Stefan Hagedorn
264		1	\|a Ilmenau \|c [2020?]
300			\|a 148 Seiten \|b Diagramme, Illustrationen (teilweise farbig)
336			\|a Text \|b txt \|2 rdacontent
337			\|a ohne Hilfsmittel zu benutzen \|b n \|2 rdamedia
338			\|a Band \|b nc \|2 rdacarrier
500			\|a Tag der Verteidigung: 06.05.2020
502			\|b Dissertation \|c Technische Universität Ilmenau \|d 2020
520			\|a Millionen Geräte, wie z.B. Mobiltelefone, Autos und Umweltsensoren senden ihre Positionen zusammen mit einem Zeitstempel und weiteren Nutzdaten an einen Server zu verschiedenen Analysezwecken. Die Positionsinformationen und übertragenen Ereignisinformationen werden als Punkte oder Polygone dargestellt. Eine weitere Art räumlicher Daten sind Rasterdaten, die zum Beispiel von Kameras und Sensoren produziert werden. Diese großen räumlich-zeitlichen Datenmengen können nur auf skalierbaren Plattformen wie Hadoop und Apache Spark verarbeitet werden, die jedoch z.B. die Nachbarschaftsinformation nicht ausnutzen können - was die Ausführung bestimmter Anfragen praktisch unmöglich macht. Die wiederholten Ausführungen der Analyseprogramme während ihrer Entwicklung und durch verschiedene Nutzer resultieren in langen Ausführungszeiten und hohen Kosten für gemietete Ressourcen, die durch die Wiederverwendung von Zwischenergebnissen reduziert werden können. Diese Arbeit beschäftigt sich mit den beiden oben beschriebenen Herausforderungen. Wir präsentieren zunächst das STARK Framework für die Verarbeitung räumlich-zeitlicher Vektor- und Rasterdaten in Apache Spark. Wir identifizieren verschiedene Algorithmen für Operatoren und analysieren, wie diese von den Eigenschaften der zugrundeliegenden Plattform profitieren können. Weiterhin wird untersucht, wie Indexe in der verteilten und parallelen Umgebung realisiert werden können. Außerdem vergleichen wir Partitionierungsmethoden, die unterschiedlich gut mit ungleichmäßiger Datenverteilung und der Größe der Datenmenge umgehen können und präsentieren einen Ansatz um die auf Operatorebene zu verarbeitende Datenmenge frühzeitig zu reduzieren. Um die Ausführungszeit von Programmen zu verkürzen, stellen wir einen Ansatz zur transparenten Materialisierung von Zwischenergebnissen vor. Dieser Ansatz benutzt ein Entscheidungsmodell, welches auf den tatsächlichen Operatorkosten basiert. In der Evaluierung vergleichen wir die verschiedenen Implementierungs- sowie Konfigurationsmöglichkeiten in STARK und identifizieren Szenarien wann Partitionierung und Indexierung eingesetzt werden sollten. Außerdem vergleichen wir STARK mit verwandten Systemen. Im zweiten Teil der Evaluierung zeigen wir, dass die transparente Wiederverwendung der materialisierten Zwischenergebnisse die Ausführungszeit der Programme signifikant verringern kann.
655		7	\|a Hochschulschrift \|0 (DE-588)4113937-9 \|0 (DE-627)105825778 \|0 (DE-576)209480580 \|2 gnd-content
689	0	0	\|D s \|0 (DE-588)4802620-7 \|0 (DE-627)472310364 \|0 (DE-576)216543657 \|a Big Data \|2 gnd
689	0	1	\|D s \|0 (DE-588)4206012-6 \|0 (DE-627)105131199 \|0 (DE-576)210172576 \|a Raumdaten \|2 gnd
689	0	2	\|D s \|0 (DE-588)4176992-2 \|0 (DE-627)104558172 \|0 (DE-576)209974400 \|a Rastergrafik \|2 gnd
689	0	3	\|D s \|0 (DE-588)4464685-9 \|0 (DE-627)232055696 \|0 (DE-576)212709771 \|a Framework \|g Informatik \|2 gnd
689	0	4	\|D s \|0 (DE-588)1129113116 \|0 (DE-627)883800829 \|0 (DE-576)486160742 \|a Apache Spark \|2 gnd
689	0	5	\|D s \|0 (DE-588)1022420135 \|0 (DE-627)716967316 \|0 (DE-576)365311405 \|a Hadoop \|2 gnd
689	0		\|5 (DE-627)
700	1		\|a Sattler, Kai-Uwe \|d 1968- \|e AkademischeR BetreuerIn \|0 (DE-588)120420392 \|0 (DE-627)080664091 \|0 (DE-576)17884845X \|4 dgs
700	1		\|a Seeger, Bernhard \|e AkademischeR BetreuerIn \|4 dgs
700	1		\|a Gertz, Michael \|e AkademischeR BetreuerIn \|0 (DE-588)1038076579 \|0 (DE-627)756636973 \|0 (DE-576)392095645 \|4 dgs
710	2		\|a Technische Universität Ilmenau \|e Grad-verleihende Institution \|0 (DE-588)2125187-3 \|0 (DE-627)121097897 \|0 (DE-576)194247589 \|4 dgg
751			\|a Ilmenau \|0 (DE-588)4026566-3 \|0 (DE-627)104745495 \|0 (DE-576)208967060 \|4 uvp
776	0	8	\|i Erscheint auch als \|n Online-Ausgabe \|a Hagedorn, Stefan, 1985 - \|t Efficient processing of large-scale spatio-temporal data \|d Ilmenau : Universitätsbibliothek, 2020 \|h 1 Online-Ressource (148 Seiten) \|w (DE-627)1724473328
856	4	2	\|u https://www.gbv.de/dms/ilmenau/toc/1698141351.PDF \|m DE-601 \|q application/pdf \|x Digitalisierung \|y Inhaltsverzeichnis \|3 Inhaltsverzeichnis
856	4	2	\|u https://www.gbv.de/dms/ilmenau/abs/1698141351haged.txt \|m DE-601 \|q text/plain \|x Archivierung \|y Abstract \|3 Abstract
924	0		\|a 3666438857 \|b DE-Ilm1 \|9 Ilm 1 \|c GBV \|d c \|g INF ST 271 D17 H141 \|h 53
924	0		\|a 3723929842 \|b DE-Ilm1 \|9 Ilm 1 \|c GBV \|d c \|g INF 20 A 893 \|h 97
936	b	k	\|a 54.64 \|j Datenbanken \|0 (DE-627)106410865
951			\|a BO
980			\|a 1698141351 \|b 183 \|c sid-183-col-kxpbbi

openURL	url_ver=Z39.88-2004&ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fkatalog.fid-bbi.de%3Agenerator&rft.title=Efficient+processing+of+large-scale+spatio-temporal+data&rft.date=%5B2020%3F%5D&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Abook&rft.genre=book&rft.btitle=Efficient+processing+of+large-scale+spatio-temporal+data&rft.au=Hagedorn%2C+Stefan&rft.pub=&rft.edition=&rft.isbn=

openURL

url_ver=Z39.88-2004&ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fkatalog.fid-bbi.de%3Agenerator&rft.title=Efficient+processing+of+large-scale+spatio-temporal+data&rft.date=%5B2020%3F%5D&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Abook&rft.genre=book&rft.btitle=Efficient+processing+of+large-scale+spatio-temporal+data&rft.au=Hagedorn%2C+Stefan&rft.pub=&rft.edition=&rft.isbn=

SOLR
_version_	1798421498050904064
author	Hagedorn, Stefan
author2	Sattler, Kai-Uwe, Seeger, Bernhard, Gertz, Michael
author2_role	dgs, dgs, dgs
author2_variant	k u s kus, b s bs, m g mg
author_corporate	Technische Universität Ilmenau
author_corporate_role	dgg
author_facet	Hagedorn, Stefan, Sattler, Kai-Uwe, Seeger, Bernhard, Gertz, Michael, Technische Universität Ilmenau
author_role	aut
author_sort	Hagedorn, Stefan 1985-
author_variant	s h sh
building	Library A
collection	sid-183-col-kxpbbi
contents	Millionen Geräte, wie z.B. Mobiltelefone, Autos und Umweltsensoren senden ihre Positionen zusammen mit einem Zeitstempel und weiteren Nutzdaten an einen Server zu verschiedenen Analysezwecken. Die Positionsinformationen und übertragenen Ereignisinformationen werden als Punkte oder Polygone dargestellt. Eine weitere Art räumlicher Daten sind Rasterdaten, die zum Beispiel von Kameras und Sensoren produziert werden. Diese großen räumlich-zeitlichen Datenmengen können nur auf skalierbaren Plattformen wie Hadoop und Apache Spark verarbeitet werden, die jedoch z.B. die Nachbarschaftsinformation nicht ausnutzen können - was die Ausführung bestimmter Anfragen praktisch unmöglich macht. Die wiederholten Ausführungen der Analyseprogramme während ihrer Entwicklung und durch verschiedene Nutzer resultieren in langen Ausführungszeiten und hohen Kosten für gemietete Ressourcen, die durch die Wiederverwendung von Zwischenergebnissen reduziert werden können. Diese Arbeit beschäftigt sich mit den beiden oben beschriebenen Herausforderungen. Wir präsentieren zunächst das STARK Framework für die Verarbeitung räumlich-zeitlicher Vektor- und Rasterdaten in Apache Spark. Wir identifizieren verschiedene Algorithmen für Operatoren und analysieren, wie diese von den Eigenschaften der zugrundeliegenden Plattform profitieren können. Weiterhin wird untersucht, wie Indexe in der verteilten und parallelen Umgebung realisiert werden können. Außerdem vergleichen wir Partitionierungsmethoden, die unterschiedlich gut mit ungleichmäßiger Datenverteilung und der Größe der Datenmenge umgehen können und präsentieren einen Ansatz um die auf Operatorebene zu verarbeitende Datenmenge frühzeitig zu reduzieren. Um die Ausführungszeit von Programmen zu verkürzen, stellen wir einen Ansatz zur transparenten Materialisierung von Zwischenergebnissen vor. Dieser Ansatz benutzt ein Entscheidungsmodell, welches auf den tatsächlichen Operatorkosten basiert. In der Evaluierung vergleichen wir die verschiedenen Implementierungs- sowie Konfigurationsmöglichkeiten in STARK und identifizieren Szenarien wann Partitionierung und Indexierung eingesetzt werden sollten. Außerdem vergleichen wir STARK mit verwandten Systemen. Im zweiten Teil der Evaluierung zeigen wir, dass die transparente Wiederverwendung der materialisierten Zwischenergebnisse die Ausführungszeit der Programme signifikant verringern kann.
ctrlnum	(DE-627)1698141351, (DE-599)KXP1698141351, (OCoLC)1375078280
facet_avail	Local
facet_local_del330	Big Data, Raumdaten, Rastergrafik, Framework, Apache Spark, Hadoop
fincclass_txtF_mv	science-computerscience
footnote	Tag der Verteidigung: 06.05.2020
format	Book, Thesis
format_access_txtF_mv	Thesis
format_de14	Book, E-Book
format_de15	Book, E-Book
format_del152	Buch
format_detail_txtF_mv	text-print-monograph-independent-thesis
format_dezi4	e-Book
format_finc	Book, E-Book, Thesis
format_legacy	Book
format_legacy_nrw	Book, E-Book
format_nrw	Book, E-Book
format_strict_txtF_mv	Thesis
genre	Hochschulschrift (DE-588)4113937-9 (DE-627)105825778 (DE-576)209480580 gnd-content
genre_facet	Hochschulschrift
geogr_code	not assigned
geogr_code_person	not assigned
id	183-1698141351
illustrated	Not Illustrated
imprint	Ilmenau, [2020?]
imprint_str_mv	Ilmenau, [2020?]
institution	FID-BBI-DE-23
is_hierarchy_id
is_hierarchy_title
language	English
last_indexed	2024-05-07T18:59:52.592Z
marc_error	[geogr_code]Unable to make public java.lang.AbstractStringBuilder java.lang.AbstractStringBuilder.append(java.lang.String) accessible: module java.base does not "opens java.lang" to unnamed module @20e8cc55
match_str	hagedorn2020efficientprocessingoflargescalespatiotemporaldata
mega_collection	K10plus Verbundkatalog
oclc_num	1375078280
physical	148 Seiten; Diagramme, Illustrationen (teilweise farbig)
publishDate	[2020?]
publishDateSort	2020
publishPlace	Ilmenau
publisher
record_format	marcfinc
record_id	1698141351
recordtype	marcfinc
rvk_facet	No subject assigned
source_id	183
spelling	Hagedorn, Stefan 1985- VerfasserIn (DE-588)1206215402 (DE-627)169200672X aut, Efficient processing of large-scale spatio-temporal data vorgelegt von Dipl.-Inf. Stefan Hagedorn, Ilmenau [2020?], 148 Seiten Diagramme, Illustrationen (teilweise farbig), Text txt rdacontent, ohne Hilfsmittel zu benutzen n rdamedia, Band nc rdacarrier, Tag der Verteidigung: 06.05.2020, Dissertation Technische Universität Ilmenau 2020, Millionen Geräte, wie z.B. Mobiltelefone, Autos und Umweltsensoren senden ihre Positionen zusammen mit einem Zeitstempel und weiteren Nutzdaten an einen Server zu verschiedenen Analysezwecken. Die Positionsinformationen und übertragenen Ereignisinformationen werden als Punkte oder Polygone dargestellt. Eine weitere Art räumlicher Daten sind Rasterdaten, die zum Beispiel von Kameras und Sensoren produziert werden. Diese großen räumlich-zeitlichen Datenmengen können nur auf skalierbaren Plattformen wie Hadoop und Apache Spark verarbeitet werden, die jedoch z.B. die Nachbarschaftsinformation nicht ausnutzen können - was die Ausführung bestimmter Anfragen praktisch unmöglich macht. Die wiederholten Ausführungen der Analyseprogramme während ihrer Entwicklung und durch verschiedene Nutzer resultieren in langen Ausführungszeiten und hohen Kosten für gemietete Ressourcen, die durch die Wiederverwendung von Zwischenergebnissen reduziert werden können. Diese Arbeit beschäftigt sich mit den beiden oben beschriebenen Herausforderungen. Wir präsentieren zunächst das STARK Framework für die Verarbeitung räumlich-zeitlicher Vektor- und Rasterdaten in Apache Spark. Wir identifizieren verschiedene Algorithmen für Operatoren und analysieren, wie diese von den Eigenschaften der zugrundeliegenden Plattform profitieren können. Weiterhin wird untersucht, wie Indexe in der verteilten und parallelen Umgebung realisiert werden können. Außerdem vergleichen wir Partitionierungsmethoden, die unterschiedlich gut mit ungleichmäßiger Datenverteilung und der Größe der Datenmenge umgehen können und präsentieren einen Ansatz um die auf Operatorebene zu verarbeitende Datenmenge frühzeitig zu reduzieren. Um die Ausführungszeit von Programmen zu verkürzen, stellen wir einen Ansatz zur transparenten Materialisierung von Zwischenergebnissen vor. Dieser Ansatz benutzt ein Entscheidungsmodell, welches auf den tatsächlichen Operatorkosten basiert. In der Evaluierung vergleichen wir die verschiedenen Implementierungs- sowie Konfigurationsmöglichkeiten in STARK und identifizieren Szenarien wann Partitionierung und Indexierung eingesetzt werden sollten. Außerdem vergleichen wir STARK mit verwandten Systemen. Im zweiten Teil der Evaluierung zeigen wir, dass die transparente Wiederverwendung der materialisierten Zwischenergebnisse die Ausführungszeit der Programme signifikant verringern kann., Hochschulschrift (DE-588)4113937-9 (DE-627)105825778 (DE-576)209480580 gnd-content, s (DE-588)4802620-7 (DE-627)472310364 (DE-576)216543657 Big Data gnd, s (DE-588)4206012-6 (DE-627)105131199 (DE-576)210172576 Raumdaten gnd, s (DE-588)4176992-2 (DE-627)104558172 (DE-576)209974400 Rastergrafik gnd, s (DE-588)4464685-9 (DE-627)232055696 (DE-576)212709771 Framework Informatik gnd, s (DE-588)1129113116 (DE-627)883800829 (DE-576)486160742 Apache Spark gnd, s (DE-588)1022420135 (DE-627)716967316 (DE-576)365311405 Hadoop gnd, (DE-627), Sattler, Kai-Uwe 1968- AkademischeR BetreuerIn (DE-588)120420392 (DE-627)080664091 (DE-576)17884845X dgs, Seeger, Bernhard AkademischeR BetreuerIn dgs, Gertz, Michael AkademischeR BetreuerIn (DE-588)1038076579 (DE-627)756636973 (DE-576)392095645 dgs, Technische Universität Ilmenau Grad-verleihende Institution (DE-588)2125187-3 (DE-627)121097897 (DE-576)194247589 dgg, Ilmenau (DE-588)4026566-3 (DE-627)104745495 (DE-576)208967060 uvp, Erscheint auch als Online-Ausgabe Hagedorn, Stefan, 1985 - Efficient processing of large-scale spatio-temporal data Ilmenau : Universitätsbibliothek, 2020 1 Online-Ressource (148 Seiten) (DE-627)1724473328, https://www.gbv.de/dms/ilmenau/toc/1698141351.PDF DE-601 application/pdf Digitalisierung Inhaltsverzeichnis Inhaltsverzeichnis, https://www.gbv.de/dms/ilmenau/abs/1698141351haged.txt DE-601 text/plain Archivierung Abstract Abstract
spellingShingle	Hagedorn, Stefan, Efficient processing of large-scale spatio-temporal data, Millionen Geräte, wie z.B. Mobiltelefone, Autos und Umweltsensoren senden ihre Positionen zusammen mit einem Zeitstempel und weiteren Nutzdaten an einen Server zu verschiedenen Analysezwecken. Die Positionsinformationen und übertragenen Ereignisinformationen werden als Punkte oder Polygone dargestellt. Eine weitere Art räumlicher Daten sind Rasterdaten, die zum Beispiel von Kameras und Sensoren produziert werden. Diese großen räumlich-zeitlichen Datenmengen können nur auf skalierbaren Plattformen wie Hadoop und Apache Spark verarbeitet werden, die jedoch z.B. die Nachbarschaftsinformation nicht ausnutzen können - was die Ausführung bestimmter Anfragen praktisch unmöglich macht. Die wiederholten Ausführungen der Analyseprogramme während ihrer Entwicklung und durch verschiedene Nutzer resultieren in langen Ausführungszeiten und hohen Kosten für gemietete Ressourcen, die durch die Wiederverwendung von Zwischenergebnissen reduziert werden können. Diese Arbeit beschäftigt sich mit den beiden oben beschriebenen Herausforderungen. Wir präsentieren zunächst das STARK Framework für die Verarbeitung räumlich-zeitlicher Vektor- und Rasterdaten in Apache Spark. Wir identifizieren verschiedene Algorithmen für Operatoren und analysieren, wie diese von den Eigenschaften der zugrundeliegenden Plattform profitieren können. Weiterhin wird untersucht, wie Indexe in der verteilten und parallelen Umgebung realisiert werden können. Außerdem vergleichen wir Partitionierungsmethoden, die unterschiedlich gut mit ungleichmäßiger Datenverteilung und der Größe der Datenmenge umgehen können und präsentieren einen Ansatz um die auf Operatorebene zu verarbeitende Datenmenge frühzeitig zu reduzieren. Um die Ausführungszeit von Programmen zu verkürzen, stellen wir einen Ansatz zur transparenten Materialisierung von Zwischenergebnissen vor. Dieser Ansatz benutzt ein Entscheidungsmodell, welches auf den tatsächlichen Operatorkosten basiert. In der Evaluierung vergleichen wir die verschiedenen Implementierungs- sowie Konfigurationsmöglichkeiten in STARK und identifizieren Szenarien wann Partitionierung und Indexierung eingesetzt werden sollten. Außerdem vergleichen wir STARK mit verwandten Systemen. Im zweiten Teil der Evaluierung zeigen wir, dass die transparente Wiederverwendung der materialisierten Zwischenergebnisse die Ausführungszeit der Programme signifikant verringern kann., Hochschulschrift, Big Data, Raumdaten, Rastergrafik, Framework Informatik, Apache Spark, Hadoop
title	Efficient processing of large-scale spatio-temporal data
title_auth	Efficient processing of large-scale spatio-temporal data
title_full	Efficient processing of large-scale spatio-temporal data vorgelegt von Dipl.-Inf. Stefan Hagedorn
title_fullStr	Efficient processing of large-scale spatio-temporal data vorgelegt von Dipl.-Inf. Stefan Hagedorn
title_full_unstemmed	Efficient processing of large-scale spatio-temporal data vorgelegt von Dipl.-Inf. Stefan Hagedorn
title_short	Efficient processing of large-scale spatio-temporal data
title_sort	efficient processing of large-scale spatio-temporal data
title_unstemmed	Efficient processing of large-scale spatio-temporal data
topic	Hochschulschrift, Big Data, Raumdaten, Rastergrafik, Framework Informatik, Apache Spark, Hadoop
topic_facet	Hochschulschrift, Big Data, Raumdaten, Rastergrafik, Framework, Apache Spark, Hadoop
url	https://www.gbv.de/dms/ilmenau/toc/1698141351.PDF, https://www.gbv.de/dms/ilmenau/abs/1698141351haged.txt
work_keys_str_mv	AT hagedornstefan efficientprocessingoflargescalespatiotemporaldata, AT sattlerkaiuwe efficientprocessingoflargescalespatiotemporaldata, AT seegerbernhard efficientprocessingoflargescalespatiotemporaldata, AT gertzmichael efficientprocessingoflargescalespatiotemporaldata, AT technischeuniversitatilmenau efficientprocessingoflargescalespatiotemporaldata

Efficient processing of large-scale spatio-temporal data

Bibliographische Detailangaben

Zugang

Andere Ausgaben