TAOZI

放飞心情.

硅谷6大增长黑客经典案例

Growth Hacker

一、To C 增长黑客案例 a. Instagram删繁就简 火爆全球的Instagram最初不是图片社交应用,他的前生是Burbn(一个包含了社交、拍照、签到、游戏的多功能应用)。尬尴的产品定位发布几周后用户量差强人意,增长停滞不前。 显然,这个一款失败的全功能应用,但是数据分析发现用户似乎很喜欢其中的照片分享功能,生死存亡之际,两位创始人做了一个决定:砍掉其他功能,只留照片、评论、点赞...

Titanic Data Science Solutions By Python

Machine Learning from Disaster Predict survival on the Titanic and get familiar with ML basics

泰坦尼克号数据科学解决方案 关于著名的泰坦尼克号数据分析应该会有一系列的文章,本文是参考于 《Titanic Data Science Solutions》, 作为自己的学习,也希望能对你有帮助。 数据科学一般的工作流程 定义问题 获取训练集和测试集 分析、探索数据 建立模型和预测数据 数据可视化以及结论报告 提交答案 当然实际情况并不完全遵守这个流程的,有...

Python for Data Exploration(1)

数据探索

这篇文章来学习下数据探索主要步骤,一般在我们搜索数据后进行数据挖掘前都需要考虑这样一些问题:数据集的数量和质量是否满足模型构建的要求?其中有什么明显的规律和趋势吗? 各个因素之间有什么样的关联性? 然后通过检验数据质量、绘制相应图标、计算某些特征量等手段对数据的结构和规律进行数据探索。 参考 python数据分析与挖掘实战 数据质量分析 首先应该就是检查数据中的脏数据...

python文本情感分析

电商产品评论数据情感分析

参考文档:http://www.tipdm.org/u/cms/www/201511/23155400syj0.pdf # -*- coding:utf-8 -*- import pandas as pd import numpy as np 评论预处理-文本去重 剔除大量无价值的词 文本去重,去除平台默认评价的词;同一用户重...

Solving A Simple Classification Problem with Python Fruits Lovers’ Edition

得到

本文为译文 原文链接:https://towardsdatascience.com/solving-a-simple-classification-problem-with-python-fruits-lovers-edition-d20ab6b071d2 原作者:Susan Li 主页地址:https://towardsdatascience.com/@actsus...

House Prices Advanced Regression Techniques

房价预测

本文源自kaggle中房价预测的一个非常高票的策略,原文作者是Pedro Marceino 原文地址:https://www.kaggle.com/pmarcelino/comprehensive-data-exploration-with-python/notebook 本文的命题是通过79个解释性变量预测每个住宅的最终价格 ...

python 亲和性分析

亲和性分析关联推荐基础

亲和性分析根据样本个体(物体)之间的相似度,确定它们关系的亲疏 案例链接 思考一组订单数据,如何计算出关联性最高的产品组合。 思路 支持度 support: 指数据集中规则应验的次数 置信度 confidence: 置信度衡量的则是规则准确率如何,即符合给定条件(即规则的“如果”语句所表示的前提条件)...