000560970 001__ 560970 000560970 005__ 20240715104115.0 000560970 020__ $$a978-3-86359-368-1 000560970 0247_ $$2URN$$aurn:nbn:de:hbz:82-rwth-2015-066881 000560970 0247_ $$2HBZ$$aHT018820505 000560970 0247_ $$2Laufende Nummer$$a34519 000560970 037__ $$aRWTH-2015-06688 000560970 041__ $$aEnglish 000560970 082__ $$a004 000560970 1001_ $$0P:(DE-82)029749$$aFärber, Ines$$b0 000560970 245__ $$aAlternative clustering in subspace projections$$cInes Färber$$hprint, online 000560970 246_3 $$aErkennung alternativer Clusteringlösungen in Teilraumprojektionen$$yGerman 000560970 250__ $$a1. Aufl. 000560970 260__ $$aAachen$$bApprimus-Verl.$$c2015 000560970 260__ $$c2016 000560970 3367_ $$0PUB:(DE-HGF)11$$2PUB:(DE-HGF)$$aDissertation / PhD Thesis$$bphd$$mphd 000560970 3367_ $$0PUB:(DE-HGF)3$$2PUB:(DE-HGF)$$aBook$$mbook 000560970 3367_ $$02$$2EndNote$$aThesis 000560970 3367_ $$2DRIVER$$adoctoralThesis 000560970 3367_ $$2BibTeX$$aPHDTHESIS 000560970 3367_ $$2DataCite$$aOutput Types/Dissertation 000560970 3367_ $$2ORCID$$aDISSERTATION 000560970 4900_ $$aErgebnisse aus der Informatik$$v6 000560970 500__ $$aWeitere Reihe: Edition Wissenschaft Apprimus. - Auch veröffentlicht auf dem Publikationsserver der RWTH Aachen University 2016 000560970 502__ $$aZugl.: Aachen, Techn. Hochsch., Diss., 2014$$bDissertation$$cZugl.: Aachen, Techn. Hochsch.$$gFak01$$o2014-12-04 000560970 5203_ $$aDer bisherige technologische Fortschritt führte zu einer Durchdringung aller Lebensbereiche mit Informationssystemen und ermöglicht das einfache und günstige Erfassen großer Datenmengen. Für unsere Informationsgesellschaft ist es jedoch entscheidend aus diesen reichhaltigen Datenquellen nützliche Informationen und Wissen zu generieren. Diesem Ziel hat sich der Forschungsbereich des Data Mining gewidmet, dessen Aufgabe es ist automatisiert oder semi-automatisiert vorher unbekannte Muster aus Daten zu extrahieren. Diese Arbeit beschäftigt sich mit der Aufgabe des Clusterings, welche Objekte anhand ihrer Ähnlichkeit gruppiert. Da moderne Speichertechnologien keine ernsthaften Grenzen mehr aufzeigen, können Daten meist in ihrer vollen Komplexität ohne eine Beschränkung auf lediglich ausgewählte Aspekte erfasst werden. Für solch komplexe Daten stellt jedoch ein einziges Clustering oft keine ausreichende Charakterisierung dar. Stattdessen lassen sich für einen Datensatz oft mehrere, unterschiedliche und sinnvolle Clusterings identifizieren. Das Paradigma des Multi-View Clusterings, auch als Alternative Clustering bezeichnet, hat sich dem Ziel verschrieben explizit nach einer solch diversen Menge mehrerer, alternativer Clusterings zu suchen um alle versteckten Muster der Daten aufzudecken. Eine zweite Beobachtung für komplexe Daten, bei welchen üblicherweise für jedes Objekt eine Vielzahl von Eigenschaften erfasst wurde, ist eine sehr schwach ausgeprägte Ähnlichkeit zwischen Objekten bei Berücksichtigung all ihrer Merkmalsausprägungen. Während ein Clustering unter Berücksichtigung aller Attribute nicht zielführend ist, lassen sich bei Betrachtung einzelner Attributteilmengen, d.h. in Teilraumprojektionen, durchaus sinnvolle Clusterstrukturen identifizieren. Dieser Problemstellung haben sich Ansätze des Subspace Clustering Paradigmas angenommen, welche Clusterstrukturen in Teilraumprojektionen identifizieren, sodass für jeden Cluster automatisch auch die Menge der relevanten Attribute bestimmt wird. In dieser Arbeit wollen wir die grundsätzlichen Parallelen beider Paradigmen, Multi-View Clustering und Subspace Clustering, hervorheben, da beiden die Eigenschaft der gleichzeitigen Zugehörigkeit einzelner Objekte zu mehreren Clustern gemein ist. Entsprechend stellen wir verschiedene Ansätze vor die durch die Kombination beider Paradigmen Synergieeffekte nutzen um mehrere, verschiedene Gruppierungen in Teilraumprojektionen zu identifizieren.$$lger 000560970 520__ $$aThe technological advancements of recent years led to a pervasion of all life areas with information systems and allows to conveniently and affordably gather large amounts of data. The key to our information society is the transformation of the mere data in these comprehensive databases into information and knowledge. One research area committed to this goal is the one of data mining, where the task is to automatically or semi-automatically extract previously unknown patterns from such data sources. The subject of this thesis is the mining task of clustering, which aims at grouping objects based on their similarity such that similar objects are grouped together, while dissimilar ones are separated. Since modern storage systems are not subject to practical limitations anymore, data can be captured in its full complexity without restriction to a small selective set of aspects. For such complex data, just identifying a single clustering is often not sufficient. Instead, multiple, alternative, and valid clusterings can be identified for a single dataset, each highlighting different aspects of the data. The paradigm of multi-view clustering, also referred to as alternative clustering, is dedicated to explicitly discover such a diverse set of multiple, alternative clusterings in order to find all hidden patterns in the data. A second observation for complex data sources, where usually many characteristics are stored for each object, is the inability to find similar objects by considering all of these characteristics. While clustering based on all attributes, in the full-space, is futile, valuable cluster patterns can be found for subsets of attributes, in subspace projections. This problem is tackled by approaches of the subspace clustering paradigm, which aim at uncovering clustering structures hidden in subspace projections, such that for each cluster a set of relevant attributes is determined automatically. In this thesis, we want to highlight fundamental parallels between the two paradigms of multi-view clustering and subspace clustering, since both account for the possibility of objects belonging to multiple clusters simultaneously. Consequently, we present several approaches exploiting synergy effects by combining both paradigms to find multiple, alternative clusterings in subspace projections of the data.$$leng 000560970 591__ $$aGermany 000560970 653_7 $$aInformatik 000560970 653_7 $$adata mining 000560970 653_7 $$aCluster-Analyse 000560970 653_7 $$aCluster 000560970 653_7 $$aClusterverfahren 000560970 653_7 $$aHochdimensionale Daten 000560970 653_7 $$aDatenbank 000560970 653_7 $$aAlgorithmus 000560970 653_7 $$aNetzwerk 000560970 653_7 $$aClustering 000560970 653_7 $$aTeilraum Clustering 000560970 653_7 $$asubspace clustering 000560970 653_7 $$aTeilraumprojektion 000560970 653_7 $$asubspace projections 000560970 653_7 $$aRedundanzentfernung 000560970 653_7 $$aredundancy avoidance 000560970 653_7 $$agraph mining 000560970 653_7 $$anetwork clustering 000560970 653_7 $$amulti-view clustering 000560970 653_7 $$aWissensextraktion 000560970 7001_ $$0P:(DE-82)001596$$aSeidl, Thomas$$b1$$eThesis advisor 000560970 7001_ $$0P:(DE-82)001595$$aAssent, Ira$$b2$$eThesis advisor 000560970 8564_ $$uhttps://publications.rwth-aachen.de/record/560970/files/560970.pdf$$yOpenAccess 000560970 8564_ $$uhttps://publications.rwth-aachen.de/record/560970/files/560970_source.zip$$yrestricted 000560970 8564_ $$uhttps://publications.rwth-aachen.de/record/560970/files/560970.gif?subformat=icon$$xicon$$yOpenAccess 000560970 8564_ $$uhttps://publications.rwth-aachen.de/record/560970/files/560970.jpg?subformat=icon-1440$$xicon-1440$$yOpenAccess 000560970 8564_ $$uhttps://publications.rwth-aachen.de/record/560970/files/560970.jpg?subformat=icon-180$$xicon-180$$yOpenAccess 000560970 8564_ $$uhttps://publications.rwth-aachen.de/record/560970/files/560970.jpg?subformat=icon-640$$xicon-640$$yOpenAccess 000560970 8564_ $$uhttps://publications.rwth-aachen.de/record/560970/files/560970.jpg?subformat=icon-700$$xicon-700$$yOpenAccess 000560970 8564_ $$uhttps://publications.rwth-aachen.de/record/560970/files/560970.pdf?subformat=pdfa$$xpdfa$$yOpenAccess 000560970 909CO $$ooai:publications.rwth-aachen.de:560970$$popenaire$$popen_access$$purn$$pdriver$$pVDB$$pdnbdelivery 000560970 9141_ $$y2015 000560970 915__ $$0StatID:(DE-HGF)0510$$2StatID$$aOpenAccess 000560970 9201_ $$0I:(DE-82)122510_20140620$$k122510$$lLehrstuhl für Informatik 9 (Datenmanagement und -exploration)$$x0 000560970 9201_ $$0I:(DE-82)120000_20140620$$k120000$$lFachgruppe Informatik$$x1 000560970 961__ $$c2016-02-17T21:14:58.818584$$x2015-11-18T11:51:43.510424$$z2016-02-17T21:14:58.818584 000560970 9801_ $$aFullTexts 000560970 980__ $$aphd 000560970 980__ $$aVDB 000560970 980__ $$abook 000560970 980__ $$aI:(DE-82)122510_20140620 000560970 980__ $$aI:(DE-82)120000_20140620 000560970 980__ $$aUNRESTRICTED