自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

杨鑫newlife的专栏

算法就是我的灵魂

  • 博客(2189)
  • 资源 (187)
  • 论坛 (1)
  • 收藏
  • 关注

原创 数据仓库Build The Data Warehouse(William H.Inmon)学习笔记目录

Inmon是经典的范式建模大师,该笔记目录是数据仓库Build The Data Warehouse(William H.Inmon)的学习笔记,内容包含书内的经典干货、随手结合实际经验的笔记心得;有相关的数据仓库建模问题可以私聊我讨论,互相学习!--- 文章持续更新中!---第一章数据仓库Build The Data Warehouse(William H.Inmon)学习笔记 --- 第一章、决策支持系统的发展第二章数据仓库Build The Data W...

2020-07-16 15:44:41 540

原创 设计模式学习笔记汇总目录

这里的的学习笔记包含JavaSE和J2EE两部分,持续更新中!其中关于学习的参考资料如下:1.菜鸟设计模式2.Head First Design Patterns(书、强烈推荐);3.大话设计模式(书、适合入门);相关的代码下载:GitHub源码设计模式学习笔记 --- 1.简单工厂模式 设计模式学习笔记 --- 2.抽象工厂模式 设计模式学习笔记 --- 3.单...

2020-04-28 21:08:53 408

原创 大数据之路、阿里巴巴大数据实践读书笔记目录

该系列持续更新中:第一章:大数据之路、阿里巴巴大数据实践读书笔记 --- 第一章、总述第二章:大数据之路、阿里巴巴大数据实践读书笔记 --- 第二章、日志采集第三章:大数据之路、阿里巴巴大数据实践读书笔记 --- 第三章、数据同步...

2020-01-12 02:09:19 1090

原创 送给订阅我专栏同学们一封信

非常感谢大家来订阅我的专栏,最早开始写博客是由于为了记笔记,大学时期打ACM,玩C/C++,毕业之后从事大数据 + 机器学习。后来逐渐变成了把自己做过的每一次项目实战的问题,技术调研、开发技能等都记录下来,到现在形成了简单的部分规模专栏。因此大家在看的时候有些文章可能不太具体,但是我会为订阅同学提供好服务。订阅的同学如果对我的文章或者某些技术问题感兴趣或者不懂得,可以私信问...

2020-01-05 19:55:40 1280 2

原创 准确率、召回率、F1值的思考

简述概念准确率(Accuracy)准确率(ACC), 所有预测正确的占总样本的比重。精确率/查准率(Precision)精确率(P):精确率/查准率,表示正确预测为正的占全部预测为正的比例。对某一类别而言为正确预测为该类别的样本数与预测为该类别的总样本数之比。召回率(Recall)召回率/查全率,表示正确预测为正的占全部实际为正的比例。对某一类别而言为正确预测为该类别的样本数与该类别的总样本数之比。F1值F1值:F1值为精确率和召回率的调和平均数,值越大越好。

2021-07-19 23:07:56 21

原创 LeetCode --- 94. Binary Tree Inorder Traversal 解题报告

Given therootof a binary tree, returnthe inorder traversal of its nodes' values.Example 1:Input: root = [1,null,2,3]Output: [1,3,2]Example 2:Input: root = []Output: []Example 3:Input: root = [1]Output: [1]Example 4:Input:...

2021-07-17 17:30:37 16

原创 LeetCode --- 392. Is Subsequence 解题报告

Given two stringssandt, returntrueifsis asubsequenceoft, orfalseotherwise.Asubsequenceof a string is a new string that is formed from the original string by deleting some (can be none) of the characters without disturbing the relative posit...

2021-07-11 23:01:45 27

原创 965. Univalued Binary Tree

A binary tree isunivaluedif every node in the tree has the same value.Returntrueif and only if the given tree is univalued.Example 1:Input: [1,1,1,1,1,null,1]Output: trueExample 2:Input: [2,2,2,5,2]Output: falseNote:The numb...

2021-07-08 23:28:36 18

原创 LeetCode --- 144. Binary Tree Preorder Traversal 解题思路

Given therootof a binary tree, returnthe preorder traversal of its nodes' values.Example 1:Input: root = [1,null,2,3]Output: [1,2,3]Example 2:Input: root = []Output: []Example 3:Input: root = [1]Output: [1]Example 4:Input...

2021-07-03 15:32:49 29

原创 LeetCode --- 942. DI String Match 解题报告

A permutationpermofn + 1integers of all the integers in the range[0, n]can be represented as a stringsof lengthnwhere:s[i] == 'I'ifperm[i] < perm[i + 1], and s[i] == 'D'ifperm[i] > perm[i + 1].Given a strings, reconstruct the permu...

2021-07-03 00:51:48 28

原创 Python实现Excel两个Sheet内容比较后写入新的Excel

需求:对于一个Excel中两个Sheet内容进行读取,判断第6个字断是否一样,如果一样写入新的Excel。# -*- coding:utf-8 -*-__author__ = 'yangxin_ryan'import openpyxlclass ExcelFunction(object): def run(self, input_file, output_file, sheet_index_1, sheet_index_2, result_sheet):

2021-06-30 01:44:24 33

原创 LeetCode --- 961. N-Repeated Element in Size 2N Array 结题报告

In a arraynumsof size2 * n, there aren + 1unique elements, and exactly one of these elements is repeatedntimes.Return the element repeatedntimes.Example 1:Input: nums[1,2,3,3]Output: 3Example 2:Input: nums[2,1,2,5,3,2]Output: 2...

2021-06-22 23:48:06 38 1

原创 大数据架构演进历史小记

简述 从古人开始记录事件,到电子化时代的数据产生,都是从时间/事件/主题/维度等角度进行基础积累多种形态的数据存储需求。经典的几种架构可以拆分出来离线、实时、流批一体、OLAP、OLTP、分析、计算等经典模块。我们在解决了ETL/ELT问题之后,又增加了对数据进行分析的需求,同时基于业务数据特征和算法的特点,可以再次对数据进行深层次的分析和挖掘。达到业务数据价值最大化的目的。那么怎么快速的理解他们呢?架构演进 第一阶段:数据文件 (古代)我们常见的账本、石子、物品等...

2021-06-21 00:00:40 76 2

原创 LeetCode --- 953. Verifying an Alien Dictionary 解题报告

In an alien language, surprisingly they also use english lowercase letters, but possiblyin a differentorder. Theorderof the alphabetis some permutationof lowercase letters.Given a sequence ofwordswritten in the alien language,and theorderof th...

2021-06-20 12:52:12 49

原创 LeetCode --- 944. Delete Columns to Make Sorted 解题报告

You are given an array ofnstringsstrs, all of the same length.The strings can be arranged such that there is one on each line, making a grid. For example,strs = ["abc", "bce", "cae"]can be arranged as:abcbcecaeYou want todeletethe columns ...

2021-06-17 01:02:54 74

原创 LeetCode --- 941. Valid Mountain Array 解题报告

Given an array of integersarr, returntrueif and only if it is a valid mountain array.Recall that arr is a mountain array if and only if:arr.length >= 3 There exists someiwith0 < i < arr.length - 1such that: arr[0] < arr[1] < ......

2021-06-13 12:31:53 38

原创 LeetCode --- 938. Range Sum of BST 解题报告

Given therootnode of a binary search tree and two integerslowandhigh, returnthe sum of values of all nodes with a value in theinclusiverange[low, high].Example 1:Input: root = [10,5,15,3,7,null,18], low = 7, high = 15Output: 32Explanat...

2021-06-06 14:02:38 37

原创 LeetCode --- 937. Reorder Data in Log Files 解题报告

You are given an array oflogs. Each log is a space-delimited string of words, where the first word is theidentifier.There are two types of logs:Letter-logs: All words (except the identifier) consist of lowercase English letters. Digit-logs: All word..

2021-05-30 16:32:05 41

原创 LeetCode --- 933. Number of Recent Calls 解题报告

You have aRecentCounterclass which counts the number of recent requests within a certain time frame.Implement theRecentCounterclass:RecentCounter()Initializes the counter with zero recent requests. int ping(int t)Adds a new request at timet, wh...

2021-05-30 02:43:08 39

原创 如何看待公司内部项目的赛马机制

简述 重复造轮子,内部项目竞争赛马,是很多大公司常见的问题。例如一个大部门-001-在做一个项目A,另外一个大部门-002-也看到了这个业务价值。打算也弄一个解决相同或者类似场景的方案项目B。当大家都知道双方项目存在时,就容易形成内部赛马机制,比开发时间和上线时间以及功能特色。从好的方面来说公司整体肯定会得到一个较好的项目,不好的方面就是浪费了时间、精力和成本。 公司角度 从公司的角度来说大部分小公司可能不会出现多条赛道的情况。一般内部竞争常常出现在大...

2021-05-25 23:52:07 149

原创 LeetCode --- 929. Unique Email Addresses 解题报告

Everyvalid emailconsists of alocal nameand adomain name, separated by the'@'sign. Besides lowercase letters, the email may contain one or more'.'or'+'.For example, in"alice@leetcode.com","alice"is thelocal name, and"leetcode.com"is thedo...

2021-05-18 00:01:47 60

原创 LeetCode --- 925. Long Pressed Name 解题报告

Your friend is typing hisnameinto a keyboard. Sometimes, when typing a characterc, the key might getlong pressed, and the character will be typed 1 or more times.You examine thetypedcharacters of the keyboard. ReturnTrueif it is possible that it ...

2021-04-24 21:32:28 78

原创 LeetCode --- 922. Sort Array By Parity II 解题报告

Given an array of integersnums, half of the integers innumsareodd, and the other half areeven.Sort the array so that whenevernums[i]is odd,iisodd, and whenevernums[i]is even,iiseven.Returnany answer array that satisfies this condition....

2021-04-24 01:49:02 82

原创 LeetCode --- 917. Reverse Only Letters 解题报告

Given a stringS, return the "reversed" string where all characters that are not a letterstay in the same place, and all letters reverse their positions.Example 1:Input: "ab-cd"Output: "dc-ba"Example 2:Input: "a-bC-dEf-ghIj"Output: "j-Ih-g...

2021-04-22 00:48:37 73

原创 LeetCode --- 914. X of a Kind in a Deck of Cards 解题报告

In a deck of cards, each card has an integer written on it.Returntrueif and only if you can chooseX >= 2such that it is possible to split the entire deck into 1 or more groups of cards, where:Each group has exactlyXcards. All the cards in eac...

2021-04-18 17:53:56 46

原创 LeetCode --- 908. Smallest Range I 解题报告

Given an arrayAof integers, for each integerA[i]we may choose anyxwith-K <= x <= K, and addxtoA[i].After this process, we have some arrayB.Return the smallest possible difference between the maximum value ofBand the minimum value of...

2021-04-10 21:38:50 62

原创 LeetCode --- 905. Sort Array By Parity 解题报告

Given an arrayAof non-negative integers, return an array consisting of all the even elements ofA, followed by all the odd elements ofA.You may return any answer array that satisfies this condition.Example 1:Input: [3,1,2,4]Output: [2,4,3,1]...

2021-03-29 22:59:48 69

原创 数据架构在公司发展的历程节点

我们无论在谈论数据平台、数据仓库、还是数据湖以及数据中台。都是一个公司数据架构或业务发展的必经阶段,这里我梳理下我之前经历过公司的数据发展历程。第一期:原始需求,需要查看业务数据的离线报表。一般使用Python脚本编写,连接业务从库,获取数据组装成为Excel利用邮件发出。第二期:由于开发速度慢,业务越来越多,通常要写上千行的SQL,维护成本极高。因此开发了邮件报表系统。第三期:参数分析的数据量越来越大,单独的对业务从库查询并不能满足需求。隐私考虑使用分布式存储的数据仓库Hiv...

2021-03-28 17:07:04 166

原创 数据开发定要思考清晰的一些事情

来新公司大约有半年多,感受还是很深刻的尤其之前一直在小公司或者创业公司深耕多年,从基础开发做到TeamLeader。从最开始的一个小事情到整个业务数据的布局都要重新思考。2020年自己从舒适圈进入了梦寐已久的大厂经过了半年的考核,发现自己的很多思维是不适合在大厂中适应的。我们之前在小公司或者创业公司,只需要做好Leader定制的方向,去完成对应的KPI即可,完成业务提出来的需求,就会拿到很好的KPI,我们称之为认真做事。如下是在大厂的个人感受(不涉及任何其他感受): 在大厂建议大家有一...

2021-03-28 16:35:00 115

原创 业务数据分层设计

数据分层 数据集成 维表数据 贴源数据 基础数据 汇总数据 基础指标 衍生指标 监管/战略/决策 数据服务体系 元数据管理 周期任务调度 数据质量管理 数据混淆系统 数据监控报警 数据治理体系 异常数据修复 干扰废弃数据 ..

2021-03-28 15:31:15 146

原创 记一次SQL左关联出现空结果的情况

前言 最近在用SQL统计数据的时候发现一个特别有意思的问题(剧透一下,我自己挖的坑),我在使用左关联的时发现结果竟是空。那么我们复现一下场景问题和问题的解决方案。过程 有如下一段左关联的SQL,t_xxx_1表是非空的数据集合,t_xxx_2 是一个空的数据集合,那么我们简单的就可以得出这个LEFT OUTER JOIN的结果是t_xxx_1的原始数据。对吗?不对....!!!SELECT t_1.id AS id, t_1.name A...

2021-02-26 00:05:29 376 1

原创 LeetCode --- 897. Increasing Order Search Tree 解题报告

Given therootof a binary search tree, rearrange the tree inin-orderso that the leftmost node in the tree is now the root of the tree, and every node has no left child and only one right child.Example 1:Input: root = [5,3,6,2,4,null,8,1,null,n...

2021-02-21 00:24:07 73

原创 LeetCode --- 896. Monotonic Array 解题报告

An array ismonotonicif it is either monotone increasing or monotone decreasing.An arrayAis monotone increasing if for alli <= j,A[i] <= A[j]. An arrayAis monotone decreasing if for alli <= j,A[i] >= A[j].Returntrueif and only i...

2021-02-19 00:50:20 80

原创 LeetCode --- 893. Groups of Special-Equivalent Strings 解题报告

You are given an arrayAof strings.AmoveontoSconsists of swapping any two even indexed characters ofS, or any two odd indexed characters ofS.Two stringsSandTarespecial-equivalentif after any number ofmoves ontoS,S == T.For example,S ...

2021-02-18 00:25:28 82

原创 LeetCode --- 892. Surface Area of 3D Shapes 解题报告

You are given ann x ngridwhere you have placed some1 x 1 x 1cubes. Each valuev = grid[i][j]represents a tower ofvcubes placed on top of cell(i, j).After placing these cubes, you have decided to glue any directly adjacent cubes to each other, fo...

2021-02-16 19:30:01 67

原创 LeetCode --- 888. Fair Candy Swap 解题报告

Alice and Bob have candy bars of different sizes:A[i]is the size of thei-th bar of candy that Alice has, andB[j]is the size of thej-th bar of candy that Bob has.Since they are friends, they would like to exchange one candy bar each so that after th...

2021-02-14 01:00:31 64

原创 LeetCode --- 884. Uncommon Words from Two Sentences 解题报告

We are given two sentencesAandB. (Asentenceis a string of space separated words. Eachwordconsists only of lowercase letters.)A word isuncommonif it appears exactly once in one of the sentences, and does not appear in the other sentence.Retur...

2021-02-03 23:49:26 88

原创 Python使用openpyxl写入Excel报错ValueError: Cannot convert to excel

报错如下:ValueError: Cannot convert to excel原因是因为我们使用语句wb = openpyxl.Workbook()ws1 = wb.active()ws = wb.create_sheet("Sheet1", 0)// 格式 [[],[]]// 报错 ws.append(i)// 正确for i in list_result: ws.append(i)原本我要写入Excel的是[[],[],[]] 格式的数据,但是由于不支持复合

2021-02-02 11:32:50 1234 1

原创 LeetCode --- 883. Projection Area of 3D Shapes 解题报告

You are given ann x ngridwhere we place some1 x 1 x 1cubes that are axis-aligned with thex,y, andzaxes.Each valuev = grid[i][j]represents a tower ofvcubes placed on top of the cell(i, j).We view the projection of these cubes onto thexy,...

2021-01-26 01:28:45 70

原创 LeetCode --- 876. Middle of the Linked List 解题报告

Given a non-empty, singlylinked list with head nodehead, returnamiddle node of linked list.If there are two middle nodes, return the second middle node.Example 1:Input: [1,2,3,4,5]Output: Node 3 from this list (Serialization: [3,4,5])The re...

2021-01-23 01:54:23 71 2

Python3实现KNN的三个例子(包含数据集),水果分类,识别手写数字,找相似的朋友

Python3实现KNN的三个例子(包含数据集),水果分类,识别手写数字,找相似的朋友

2019-03-06

demjson-2.2.4

demjson-2.2.4很好用,适合于python操作json使用。

2016-08-02

软件开发文档模板[全套]

软件开发文档模板[全套]

2017-04-07

ElasticSearch中文文档(新版)

ElasticSearch中文文档(新版)

2017-06-23

_bz2.cpython-36m-x86_64-linux-gnu.so

_bz2.cpython-36m-x86_64-linux-gnu.so,

2019-11-07

AzkabanAPI接口文档汇总

AzkabanAPI接口文档汇总

2018-09-26

ACM学习路线导图

ACM学习路线导图

2018-11-14

数据仓库规范设计.pdf

数据仓库规范设计.pdf

2019-11-04

Confluence-5.6.6-language-pack-zh_CN.jar

Confluence-5.6.6-language-pack-zh_CN.jar,防止confluence乱码的jar包

2018-09-30

KNN实现水果分类的数据集

KNN实现水果分类的数据集KNN实现水果分类的数据集,KNN实现水果分类的数据集,KNN实现水果分类的数据集

2019-10-17

cyrus-sasl-plain-2.1.26-20

cyrus-sasl-plain-2.1.26-20,用于安装sasl。

2016-10-08

哈希算法C语言实现

哈希算法C语言实现

2016-02-17

机器学习算法-神经网络LSTM

机器学习算法-神经网络.pptx

2019-09-21

easygui-0.96.tar.gz

easygui-0.96.tar.gz 在linux下的使用,很好用,有需要的自己去下载吧。

2016-06-09

pandas-0.19.2.tar.gz

pandas-0.19.2.tar.gz 用于开发操作数据分析等

2017-02-21

openpyxl-openpyx

openpyxl 挺好用的一个lib包,需要自己进行编译。

2016-09-09

jsp实现购物车

这个使用jsp实现的购物车代码,和我上次上传的servlet实现的购物车正好行对应,适合新手学习。

2015-03-25

C语言实现prim算法

C语言实现prim算法

2015-08-12

Griffin数据质量管理技术调研.pdf

Griffin数据质量管理技术调研.pdf

2019-12-09

Azkaban元数据库分析

Azkaban元数据库分析,

2018-09-19

Presto资源管理Rest API 文档

Presto资源管理Rest API 文档

2018-12-01

easygui-docs-0.96.zip

easygui-docs-0.96.zip,在windows下的文档说明,很好用!

2016-06-09

java连接DB2所有jar包

java, python等通过jdbc连接DB2数据库的连接jar文件集合。

2017-02-14

C语言实现银行模拟-数据结构应用

C语言实现银行模拟-数据结构应用,很好用,有需要的来下载。

2016-03-28

基础算法 - 动态规划-2019-08-01.pptx

基础算法 - 动态规划-2019-08-01.pptx,基础算法 - 动态规划-2019-08-01.pptx,基础算法 - 动态规划-2019-08-01.pptx,基础算法 - 动态规划-2019-08-01.pptx

2019-10-17

C语言实现链式队列

链式队列

2015-09-08

C语言实现循环队列

C语言实现循环队列

2015-09-08

中文停用词表

中文停用词表,很好用,找了很久才找到,有需要的去下载就好了。

2016-03-28

完整的VISIO教程.ppt

完整的VISIO教程.ppt

2017-03-23

实时指标计算引擎-Spark-Part_1_杨鑫_2019-12-19.pptx

实时指标计算引擎-Spark-Part_1_杨鑫

2019-12-19

开源SuperSet、MetaBD、Redash简单对比

开源SuperSet、MetaBD、Redash简单对比

2020-07-22

servlet-api.jar && jsp-api.jar

servlet-api.jar && jsp-api.jar

2015-03-13

Python对Excel操作详解

Python对Excel操作详解,很好用,里面有xlrd, xlwt怎么使用。

2016-09-13

C语言实现串存储

C语言实现串存储

2015-09-08

Apache Kylin竞品分析.pdf

Apache Kylin竞品分析.pdf

2019-11-18

宽依赖与窄依赖

宽依赖与窄依赖,很好用的PPT,对于spreak的宽依赖与窄依赖很清楚,分享给有用的朋友。

2016-05-06

英文停用词表Stop

英文停用词表Stop,很好用,有需要的去下载

2016-03-29

Hive编程指南

Hive编程指南 pdf,内容很不错适合入门hive编程的朋友。

2017-09-13

mongodb-linux-x86_64-3.4.6

mongodb-linux-x86_64-3.4.6,很好用的客户端,请下载使用。

2017-10-17

串的块链存储表示

串的块链存储表示

2015-09-08

杨鑫newlfe的留言板

发表于 2020-01-02 最后回复 2020-04-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除