Text Mining and Visualization

Case Studies Using Open-Source Tools

Author: Markus Hofmann,Andrew Chisholm

Publisher: CRC Press

ISBN: 148223758X

Category: Business & Economics

Page: 297

View: 9792

Release On

Text Mining and Visualization: Case Studies Using Open-Source Tools provides an introduction to text mining using some of the most popular and powerful open-source tools: KNIME, RapidMiner, Weka, R, and Python. The contributors—all highly experienced with text mining and open-source software—explain how text data are gathered and processed from a wide variety of sources, including books, server access logs, websites, social media sites, and message boards. Each chapter presents a case study that you can follow as part of a step-by-step, reproducible example. You can also easily apply and extend the techniques to other problems. All the examples are available on a supplementary website. The book shows you how to exploit your text data, offering successful application examples and blueprints for you to tackle your text mining tasks and benefit from open and freely available tools. It gets you up to date on the latest and most powerful tools, the data mining process, and specific text mining activities.

Feature Engineering for Machine Learning and Data Analytics

Author: Guozhu Dong,Huan Liu

Publisher: CRC Press

ISBN: 1351721275

Category: Business & Economics

Page: 400

View: 5376

Release On

Feature engineering plays a vital role in big data analytics. Machine learning and data mining algorithms cannot work without data. Little can be achieved if there are few features to represent the underlying data objects, and the quality of results of those algorithms largely depends on the quality of the available features. Feature Engineering for Machine Learning and Data Analytics provides a comprehensive introduction to feature engineering, including feature generation, feature extraction, feature transformation, feature selection, and feature analysis and evaluation. The book presents key concepts, methods, examples, and applications, as well as chapters on feature engineering for major data types such as texts, images, sequences, time series, graphs, streaming data, software engineering data, Twitter data, and social media data. It also contains generic feature generation approaches, as well as methods for generating tried-and-tested, hand-crafted, domain-specific features. The first chapter defines the concepts of features and feature engineering, offers an overview of the book, and provides pointers to topics not covered in this book. The next six chapters are devoted to feature engineering, including feature generation for specific data types. The subsequent four chapters cover generic approaches for feature engineering, namely feature selection, feature transformation based feature engineering, deep learning based feature engineering, and pattern based feature generation and engineering. The last three chapters discuss feature engineering for social bot detection, software management, and Twitter-based applications respectively. This book can be used as a reference for data analysts, big data scientists, data preprocessing workers, project managers, project developers, prediction modelers, professors, researchers, graduate students, and upper level undergraduate students. It can also be used as the primary text for courses on feature engineering, or as a supplement for courses on machine learning, data mining, and big data analytics.

Exploratory Data Analysis Using R

Author: Ronald K. Pearson

Publisher: CRC Press

ISBN: 0429847033

Category: Business & Economics

Page: 548

View: 3817

Release On

Exploratory Data Analysis Using R provides a classroom-tested introduction to exploratory data analysis (EDA) and introduces the range of "interesting" – good, bad, and ugly – features that can be found in data, and why it is important to find them. It also introduces the mechanics of using R to explore and explain data. The book begins with a detailed overview of data, exploratory analysis, and R, as well as graphics in R. It then explores working with external data, linear regression models, and crafting data stories. The second part of the book focuses on developing R programs, including good programming practices and examples, working with text data, and general predictive models. The book ends with a chapter on "keeping it all together" that includes managing the R installation, managing files, documenting, and an introduction to reproducible computing. The book is designed for both advanced undergraduate, entry-level graduate students, and working professionals with little to no prior exposure to data analysis, modeling, statistics, or programming. it keeps the treatment relatively non-mathematical, even though data analysis is an inherently mathematical subject. Exercises are included at the end of most chapters, and an instructor's solution manual is available. About the Author: Ronald K. Pearson holds the position of Senior Data Scientist with GeoVera, a property insurance company in Fairfield, California, and he has previously held similar positions in a variety of application areas, including software development, drug safety data analysis, and the analysis of industrial process data. He holds a PhD in Electrical Engineering and Computer Science from the Massachusetts Institute of Technology and has published conference and journal papers on topics ranging from nonlinear dynamic model structure selection to the problems of disguised missing data in predictive modeling. Dr. Pearson has authored or co-authored books including Exploring Data in Engineering, the Sciences, and Medicine (Oxford University Press, 2011) and Nonlinear Digital Filtering with Python. He is also the developer of the DataCamp course on base R graphics and is an author of the datarobot and GoodmanKruskal R packages available from CRAN (the Comprehensive R Archive Network).

Human Capital Systems, Analytics, and Data Mining

Author: Robert C. Hughes

Publisher: CRC Press

ISBN: 1351649701

Category: Business & Economics

Page: 272

View: 7204

Release On

Human Capital Systems, Analytics, and Data Mining provides human capital professionals, researchers, and students with a comprehensive and portable guide to human capital systems, analytics and data mining. The main purpose of this book is to provide a rich tool set of methods and tutorials for Human Capital Management Systems (HCMS) database modeling, analytics, interactive dashboards, and data mining that is independent of any human capital software vendor offerings and is equally usable and portable among both commercial and internally developed HCMS. The book begins with an overview of HCMS, including coverage of human resource systems history and current HCMS Computing Environments. It next explores relational and dimensional database management concepts and principles. HCMS Instructional databases developed by the Author for use in Graduate Level HCMS and Compensation Courses are used for database modeling and dashboard design exercises. Exciting knowledge discovery and research Tutorials and Exercises using Online Analytical Processing (OLAP) and data mining tools through replication of actual original pay equity research by the author are included. New findings concerning Gender Based Pay Equity Research through the lens Comparable Worth and Occupational Mobility are covered extensively in Human Capital Metrics, Analytics and Data Mining Chapters.


Data Mining Use Cases and Business Analytics Applications

Author: Markus Hofmann,Ralf Klinkenberg

Publisher: CRC Press

ISBN: 1482205505

Category: Business & Economics

Page: 525

View: 989

Release On

Powerful, Flexible Tools for a Data-Driven World As the data deluge continues in today’s world, the need to master data mining, predictive analytics, and business analytics has never been greater. These techniques and tools provide unprecedented insights into data, enabling better decision making and forecasting, and ultimately the solution of increasingly complex problems. Learn from the Creators of the RapidMiner Software Written by leaders in the data mining community, including the developers of the RapidMiner software, RapidMiner: Data Mining Use Cases and Business Analytics Applications provides an in-depth introduction to the application of data mining and business analytics techniques and tools in scientific research, medicine, industry, commerce, and diverse other sectors. It presents the most powerful and flexible open source software solutions: RapidMiner and RapidAnalytics. The software and their extensions can be freely downloaded at www.RapidMiner.com. Understand Each Stage of the Data Mining Process The book and software tools cover all relevant steps of the data mining process, from data loading, transformation, integration, aggregation, and visualization to automated feature selection, automated parameter and process optimization, and integration with other tools, such as R packages or your IT infrastructure via web services. The book and software also extensively discuss the analysis of unstructured data, including text and image mining. Easily Implement Analytics Approaches Using RapidMiner and RapidAnalytics Each chapter describes an application, how to approach it with data mining methods, and how to implement it with RapidMiner and RapidAnalytics. These application-oriented chapters give you not only the necessary analytics to solve problems and tasks, but also reproducible, step-by-step descriptions of using RapidMiner and RapidAnalytics. The case studies serve as blueprints for your own data mining applications, enabling you to effectively solve similar problems.

R in a Nutshell

Author: Joseph Adler

Publisher: O'Reilly Germany

ISBN: 3897216507

Category: Computers

Page: 768

View: 6444

Release On

Wozu sollte man R lernen? Da gibt es viele Gründe: Weil man damit natürlich ganz andere Möglichkeiten hat als mit einer Tabellenkalkulation wie Excel, aber auch mehr Spielraum als mit gängiger Statistiksoftware wie SPSS und SAS. Anders als bei diesen Programmen hat man nämlich direkten Zugriff auf dieselbe, vollwertige Programmiersprache, mit der die fertigen Analyse- und Visualisierungsmethoden realisiert sind – so lassen sich nahtlos eigene Algorithmen integrieren und komplexe Arbeitsabläufe realisieren. Und nicht zuletzt, weil R offen gegenüber beliebigen Datenquellen ist, von der einfachen Textdatei über binäre Fremdformate bis hin zu den ganz großen relationalen Datenbanken. Zudem ist R Open Source und erobert momentan von der universitären Welt aus die professionelle Statistik. R kann viel. Und Sie können viel mit R machen – wenn Sie wissen, wie es geht. Willkommen in der R-Welt: Installieren Sie R und stöbern Sie in Ihrem gut bestückten Werkzeugkasten: Sie haben eine Konsole und eine grafische Benutzeroberfläche, unzählige vordefinierte Analyse- und Visualisierungsoperationen – und Pakete, Pakete, Pakete. Für quasi jeden statistischen Anwendungsbereich können Sie sich aus dem reichen Schatz der R-Community bedienen. Sprechen Sie R! Sie müssen Syntax und Grammatik von R nicht lernen – wie im Auslandsurlaub kommen Sie auch hier gut mit ein paar aufgeschnappten Brocken aus. Aber es lohnt sich: Wenn Sie wissen, was es mit R-Objekten auf sich hat, wie Sie eigene Funktionen schreiben und Ihre eigenen Pakete schnüren, sind Sie bei der Analyse Ihrer Daten noch flexibler und effektiver. Datenanalyse und Statistik in der Praxis: Anhand unzähliger Beispiele aus Medizin, Wirtschaft, Sport und Bioinformatik lernen Sie, wie Sie Daten aufbereiten, mithilfe der Grafikfunktionen des lattice-Pakets darstellen, statistische Tests durchführen und Modelle anpassen. Danach werden Ihnen Ihre Daten nichts mehr verheimlichen.

Kompendium Systembiologie

Mathematische Modellierung und Modellanalyse

Author: Andreas Kremling

Publisher: Springer-Verlag

ISBN: 3834886076

Category: Science

Page: 300

View: 3543

Release On

Das Buch beschreibt die Grundlagen der mathematischen Modellierung zellulärer Systeme. Nach einer Klassifikation von Modellen wird schwerpunktmäßig auf deterministische Modelle eingegangen und für alle relevanten zellulären Prozesse entsprechende Gleichungen angegeben. Anschließend werden eine Reihe von Verfahren zur Modellanalyse vorgestellt. Etwas kürzer werden Verfahren zum Reverse Engineering und zur Analyse von Netzwerkgraphen abgehandelt. Am Ende werden noch Verfahren der Parameteridentifikation besprochen.

Real-Time Data Mining

Author: Florian Stompe

Publisher: Diplomica Verlag

ISBN: 3836678799

Category: Business & Economics

Page: 106

View: 2962

Release On

Data Mining ist ein inzwischen etabliertes, erfolgreiches Werkzeug zur Extraktion von neuem, bislang unbekanntem Wissen aus Daten. In mittlerweile fast allen gr eren Unternehmen wird es genutzt um Mehrwerte f r Kunden zu generieren, den Erfolg von Marketingkampagnen zu erh hen, Betrugsverdacht aufzudecken oder beispielsweise durch Segmentierung unterschiedliche Kundengruppen zu identifizieren. Ein Grundproblem der intelligenten Datenanalyse besteht darin, dass Daten oftmals in rasanter Geschwindigkeit neu entstehen. Eink ufe im Supermarkt, Telefonverbindungen oder der ffentliche Verkehr erzeugen t glich eine neue Flut an Daten, in denen potentiell wertvolles Wissen steckt. Die versteckten Zusammenh nge und Muster k nnen sich im Zeitverlauf mehr oder weniger stark ver ndern. Datenmodellierung findet in der Regel aber noch immer einmalig bzw. sporadisch auf dem Snapshot einer Datenbank statt. Einmal erkannte Muster oder Zusammenh nge werden auch dann noch angenommen, wenn diese l ngst nicht mehr bestehen. Gerade in dynamischen Umgebungen wie zum Beispiel einem Internet-Shop sind Data Mining Modelle daher schnell veraltet. Betrugsversuche k nnen dann unter Umst nden nicht mehr erkannt, Absatzpotentiale nicht mehr genutzt werden oder Produktempfehlungen basieren auf veralteten Warenk rben. Um dauerhaft Wettbewerbsvorteile erzielen zu k nnen, muss das Wissen ber Daten aber m glichst aktuell und von ausgezeichneter Qualit t sein. Der Inhalt dieses Buches skizziert Methoden und Vorgehensweisen von Data Mining in Echtzeit.

Datenanalyse mit Python

Auswertung von Daten mit Pandas, NumPy und IPython

Author: Wes McKinney

Publisher: O'Reilly

ISBN: 3960102143

Category: Computers

Page: 542

View: 2939

Release On

Erfahren Sie alles über das Manipulieren, Bereinigen, Verarbeiten und Aufbereiten von Datensätzen mit Python: Aktualisiert auf Python 3.6, zeigt Ihnen dieses konsequent praxisbezogene Buch anhand konkreter Fallbeispiele, wie Sie eine Vielzahl von typischen Datenanalyse-Problemen effektiv lösen. Gleichzeitig lernen Sie die neuesten Versionen von pandas, NumPy, IPython und Jupyter kennen.Geschrieben von Wes McKinney, dem Begründer des pandas-Projekts, bietet Datenanalyse mit Python einen praktischen Einstieg in die Data-Science-Tools von Python. Das Buch eignet sich sowohl für Datenanalysten, für die Python Neuland ist, als auch für Python-Programmierer, die sich in Data Science und Scientific Computing einarbeiten wollen. Daten und zugehöriges Material des Buchs sind auf GitHub verfügbar.Aus dem Inhalt:Nutzen Sie die IPython-Shell und Jupyter Notebook für das explorative ComputingLernen Sie Grundfunktionen und fortgeschrittene Features von NumPy kennenSetzen Sie die Datenanalyse-Tools der pandasBibliothek einVerwenden Sie flexible Werkzeuge zum Laden, Bereinigen, Transformieren, Zusammenführen und Umformen von DatenErstellen Sie interformative Visualisierungen mit matplotlibWenden Sie die GroupBy-Mechanismen von pandas an, um Datensätzen zurechtzuschneiden, umzugestalten und zusammenzufassenAnalysieren und manipulieren Sie verschiedenste Zeitreihen-DatenFür diese aktualisierte 2. Auflage wurde der gesamte Code an Python 3.6 und die neuesten Versionen der pandas-Bibliothek angepasst. Neu in dieser Auflage: Informationen zu fortgeschrittenen pandas-Tools sowie eine kurze Einführung in statsmodels und scikit-learn.

R für Dummies

Author: Andrie de Vries,Robert Leidenfrost

Publisher: John Wiley & Sons

ISBN: 3527812520

Category: Computers

Page: 414

View: 3453

Release On

Formale Begriffsanalyse

Mathematische Grundlagen

Author: Bernhard Ganter,Rudolf Wille

Publisher: Springer-Verlag

ISBN: 3642614507

Category: Computers

Page: 286

View: 5378

Release On

Dieses erste Lehrbuch zur Formalen Begriffsanalyse gibt eine systematische Darstellung der mathematischen Grundlagen und ihrer Verbindung zu Anwendungen in der Informatik, insbesondere in der Datenanalyse und Wissensverarbeitung. Das Buch vermittelt vor allem Methoden der graphischen Darstellung von Begriffssystemen, die sich in der Wissenskommunikation bestens bewährt haben. Theorie und graphische Darstellung werden dabei eng miteinander verknüpft. Die mathematischen Grundlagen werden vollständig abgehandelt und durch zahlreiche Beispiele anschaulich gemacht. Da zur Wissensverarbeitung immer stärker der Computer genutzt wird, gewinnen formale Methoden begrifflicher Analyse überall an Bedeutung. Das Buch macht die dafür grundlegende Theorie in kompakter Form zugänglich.

Ganzheitliche Produktionssysteme. Wie lassen sich Unternehmensziele mit effektiver Standardisierung zusammenbringen?

Author: Susanne Viertbauer

Publisher: GRIN Verlag

ISBN: 3960953143

Category: Technology & Engineering

Page: 71

View: 2659

Release On

In unserer wettbewerbsorientierten Welt ist Effektivität der Schlüssel zum Erfolg. Kein Wunder also, dass Ganzheitliche Produktionssysteme immer mehr an Bedeutung gewinnen. Durch die Optimierung von Material- und Informationsflüssen haben Ganzheitliche Produktionssysteme das Ziel, die gesamte Wertschöpfungskette eines Unternehmens zu verbessern und so die Effektivität zu steigern. Susanne Viertbauer untersucht in dieser Publikation die Merkmale eines fähigen Ganzheitlichen Produktionssystems und überprüft, ob diese Systeme die erfolgreiche Umsetzung von Unternehmenszielen tatsächlich begünstigen. Dazu beleuchtet Viertbauer Ganzheitliche Produktionssysteme aus acht verschiedenen Perspektiven. Abschließend präsentiert sie außerdem Methoden und Werkzeuge zur Umsetzung in der Praxis. Aus dem Inhalt: - Ganzheitliche Produktionssysteme; - Effektivität; - Unternehmensziele; - Produktion; - Management

Grundlagen der Nachhaltigen Entwicklung

Handlungsmöglichkeiten und Strategien zur Umsetzung

Author: Ariane Kropp

Publisher: Springer-Verlag

ISBN: 365823072X

Category: Business & Economics

Page: 49

View: 3185

Release On

Dieser Band gibt einen Überblick über das Leitbild Nachhaltiger Entwicklung aus wirtschaftlicher und ethischer Perspektive und befasst sich mit dessen Umsetzungsmöglichkeiten. Trotz besseren Wissens handeln Menschen oft nicht nachhaltig. Warum ist das so? Ariane Kropp zeigt Ansatzpunkte und Lösungsmöglichkeiten auf. Das Buch möchte zu Nachhaltiger Entwicklung anregen, zum Reparieren, Tauschen und Teilen. Dabei bleibt die Entwicklung neuer Wirtschaftsformen, die frei von Wachstumszwängen sind, für die erfolgreiche Transformation in eine nachhaltige Gesellschaft essentiell.

Computational Social Network Analysis

Trends, Tools and Research Advances

Author: Kai Subel,Michel Schultz

Publisher: GRIN Verlag

ISBN: 3640733061

Category: Computers

Page: 21

View: 2081

Release On

Studienarbeit aus dem Jahr 2010 im Fachbereich Informatik - Internet, neue Technologien, Universität Hamburg, Sprache: Deutsch, Abstract: Diese Ausarbeitung befasst sich mit dem Thema Computational Soical Network Analysis. Ziel ist es, dem Leser einen Einblick in diese Thematik zu verschaffen. Dabei werden Hintergründe, anwendbare Methoden und Tools vorgestellt, die hierbei Verwendung finden. Zunächst wird dabei näher auf den Hintergrund, also warum dieses Gebiet als Forschungsgegenstand so interessant ist, eingegangen. Anschließend werden verschiedene Aspekte, die man im Rahmen der Analyse sozialer Netzwerke untersuchen kann benannt. In diesem Zusammenhang werden auch zwei verschiedene Kategorien zur formalen Analyse benannt. Zur Verdeutlichung wird die Verwendung dieser am Ende des Kapitels auch noch einmal anhand eines Praxisbeispiels gezeigt. Das nächste Kapitel befasst sich mit der Fragstellung, wie Schlüsselfiguren in Netzwerken ermittelt werden können und was für Rollen diese spielen. Dabei werden auch die verschiedenen Arten von Schlüsselfiguren benannt. Eine weitere zentrale Rolle in der Analyse sozialer Netzwerke nehmen Gruppen ein. Die Bedeutung von Gruppen und wie man sie ermitteln kann wird im nächsten Kapitel erläutert. Aufbauend auf den Gruppen sollen Interaktionen innerhalb von Netzwerken untersucht werden. Hierfür werden zunächst die nötigen Werkzeuge, wie die SCAN oder DISSECT Methode vorgestellt und anschließend die Einsatzgebiete anhand von Beispielen verdeutlicht. Im 7. Kapitel wird eine eLearning Plattform näher betrachtet. Hierbei werden zunächst die Eigenschaften und Besonderheiten von eLearning Plattformen beschrieben und anschießend anhand eines Praxisbeispiels verschiedene Methoden zur Analyse sozialer Netzwerke angewendet.

Virtuelle Mitarbeiterbeteiligung

Grundlagen, Aufbau und praktische Formulierungsbeispiele

Author: Christopher Hahn

Publisher: Springer-Verlag

ISBN: 3658235659

Category: Business & Economics

Page: 39

View: 4073

Release On

Das essential vermittelt einen Einblick in den Aufbau, die Funktionsweise und typische Regelungen eines „Virtual Stock Option“-Programms zur Mitarbeiterbeteiligung. Der Autor erläutert die Bedeutung der Mitarbeiterbeteiligung als Bestandteil einer zeitgemäßen Unternehmenskultur sowie deren Notwendigkeit für junge und etablierte Unternehmen, um die talentierten, qualifizierten und leistungsbewussten Mitarbeiter zu halten und zu binden. Das essential enthält zahlreiche Formulierungsbeispiele, die die Umsetzung in die Praxis erleichtern. Die 2. Auflage wurde dabei vollständig überarbeitetet und aktualisiert.

Informatik kompakt

Eine grundlegende Einführung mit Java

Author: Katharina Morik,Volker Klingspor

Publisher: Springer-Verlag

ISBN: 3540292756

Category: Computers

Page: 234

View: 9557

Release On

Die Autoren geben eine fundierte Einführung in die Informatik, die von Anfang an die Zusammenhänge zwischen den Teilgebieten des Faches betont. Das Buch ist kompakt, weil der gemeinsame Kern der verschiedenen Informatikgebiete betrachtet wird. In einer integrativen Sichtweise werden Modellierung, abstrakte Datentypen, Algorithmen sowie nebenläufige und verteilte Programmierung behandelt. Die grundlegenden Konzepte der Informatik werden dabei mittels der Programmiersprache Java realisiert. Wesentliches Anliegen der Autoren ist es, die Informatik als Wissenschaft der Abstraktion herauszustellen und in diesem Sinne den Studierenden allgemeine Methoden zum Lösen praktischer Probleme zu vermitteln. Lernkontrollen und ein effektiver Index, der vor allem diejenigen Begriffe aufführt, die ein Informatiker einfach können muss, ermöglichen ein fokussiertes Studium. Ferner stehen vielfältige Programm-Beispiele im Internet bereit.

Data mining, data warehousing

datenschutzrechtliche Orientierungshilfen für Privatunternehmen

Author: Alex Schweizer

Publisher: N.A

ISBN: 9783280025406

Category: Data mining

Page: 416

View: 7276

Release On

Private Unternehmung.


Modelle, Methoden und Anwendungen

Author: Ludwig Fahrmeir,Thomas Kneib,Stefan Lang

Publisher: Springer-Verlag

ISBN: 3642018378

Category: Business & Economics

Page: 502

View: 7161

Release On

In dem Band beschreiben die Autoren erstmals klassische Regressionsansätze und moderne nicht- und semiparametrische Methoden in einer integrierten und anwendungsorientierten Form. Um Lesern die Analyse eigener Fragestellungen zu ermöglichen, demonstrieren sie die praktische Anwendung der Konzepte und Methoden anhand ausführlicher Fallstudien. Geeignet für Studierende der Statistik sowie für Wissenschaftler und Praktiker, zum Beispiel in den Wirtschafts- und Sozialwissenschaften, der Bioinformatik und -statistik, Ökonometrie und Epidemiologie.