iPine's Blog

看似无意义的事,竟是有意义的


  • 首页

  • 关于

  • 标签

  • 分类

  • 归档

  • 搜索

易忘易忽略的Python入门知识点-续(一)

发表于 2019-05-05 | 分类于 technique summary
迭代器与生成器 迭代器 迭代是Python最强大的功能之一,是访问集合元素的一种方式。 迭代器是一个可以记住遍历位置的对象。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束,它只能往前不会后退。 迭代器,常用的两个方法iter()和next(); import os list1 ...
阅读全文 »

实习碰壁之后-正式入坑数据分析

发表于 2019-05-04 | 分类于 method
目前的状态 我是一名计算机专业的在读研究生,研究方向是数据可视化,可视分析。从实验室以及研究方向来看,周边大部分同学选择了前端开发,少部分也有做后台的。而我个人并不是特别愿意去做前端开发,我想做数据分析,数据挖掘相关的工作。目前,正是找实习的时候,但是我找数据分析的岗并不顺利,迟迟没有拿到实习of ...
阅读全文 »

易忘易忽略的Python入门知识点

发表于 2019-05-04 | 分类于 technique summary
最近在复习Python的基础知识,发现一些易忽略和忘记的点,这里做一些总结。 可改变 VS 不可改变 不可改变的数据类型包括:数值、字符串和元组;而可改变的数据类型包括:列表、字典、集合。需要注意字典的key必须为不可变类型;集合虽然是可变的但是它要求包含的元素是不可变类型。不可变类型换一种更官方 ...
阅读全文 »

散列表

发表于 2018-12-18 | 分类于 technique summary
散列表效率 之前讲到散列表的查询效率并不能笼统地说成是 O(1) 。它跟散列函数、装载因子、散列冲突都有关系。在极端情况下,恶意攻击者,通过精心构造的数据,使得所有数据经过散列函数后,都散列到同一个槽里。若我们使用的是基于链表的冲突解决办法,那这个时候,散列表就会退化为链表,查询时间度也退化为 ...
阅读全文 »

探索气温趋势

发表于 2018-11-26 | 分类于 project
代码传送门,包括扩展了交互功能的改进版 背景 分析全球和自己所在地的气温数据,比较所在城市的气温走向与全球气温走向。 数据获取 从数据库中提取数据。通过Udacity提供的工作区,该工作区与数据库连接。 方法一 写入以下SQL语句,导出世界气温数据以及最接近自己居住地的大城市气温数据。 ...
阅读全文 »

散列表

发表于 2018-11-18 | 分类于 technique summary
问题 Word有个拼写检查功能,一旦输入的英文单词有错,它就会在单词下方画上红色的波浪线。这个功能是如何实现的? 散列表 散列表叫Hash Table,即哈希表或者Hash表。散列表用的是数组支持按照下标随机访问数据的特性,所以散列表其实是数组的一种扩展,由数组演化而来。如果没有数组,就没有散列 ...
阅读全文 »

跳表

发表于 2018-11-15 | 分类于 technique summary
二分查找底层依赖的是数组随机访问的特性,所有只能用数组实现。 数据存储在链表中,通过改造链表,也可以支持类似二分的查找算法。这种改造之后的数据结构叫作跳表。 跳表是一种各方面性能都比较优秀的动态数据结构,可以支持快速的插入、删除、查找操作。 可替代红黑树,代码实现比红黑树简单 问题 为什么 R ...
阅读全文 »

二分查找

发表于 2018-11-10 | 分类于 technique summary
问题 通过IP地址可用查找到IP归属地。在百度搜索框里,随便输入一个IP地址,就会看到它的归属地。 这个功能是通过维护一个很大的IP地址库来实现的,地址库中包括IP地址范围和归属地的对应关系。 问题是,如果有12万条这样的IP区间与归属地的对应关系,如何快速定位出一个IP地址的归属地呢? 二分查 ...
阅读全文 »

二分查找

发表于 2018-11-08 | 分类于 technique summary
问题 假设有1000万个整数数据,每个数据占8字节,如何设计数据结构和算法,快速判断某个整数是否出现在1000万数据中?(存在多次查找的情况) 前提:该功能不要太占用内存空间,最好不超过100MB 二分查找思想 栗子 生活中的“猜数字大小”游戏,猜的过程中,玩家每猜一次,庄家告诉你是猜大了 ...
阅读全文 »

排序

发表于 2018-11-04 | 分类于 technique summary
主要内容,总结前面的几种算法在各方面的性能。 如何选择合适的排序算法? 总结前面几种主要排序算法的性能差异。一些算法在一些指标上达到最优情况,还有一些算法的复杂度虽然相同,但在实践中的表现却有差异。 最理想的排序算法是 O(n logn) 时间、O(1)空间、稳定、最好还具有适应性。当然目前,还没 ...
阅读全文 »
123…7
iPine

iPine

Hello, it's me

63 日志
10 分类
22 标签
GitHub E-Mail
Links
  • Leeon Notes
© 2018 — 2019 iPine
由 Hexo 强力驱动
|
主题 — NexT.Mist v5.1.4