易忘易忽略的Python入门知识点-续(一)

发表于 2019-05-05 | 分类于 technique summary

迭代器与生成器迭代器迭代是Python最强大的功能之一，是访问集合元素的一种方式。迭代器是一个可以记住遍历位置的对象。迭代器对象从集合的第一个元素开始访问，直到所有的元素被访问完结束，它只能往前不会后退。迭代器，常用的两个方法iter()和next()； import os list1 ...

阅读全文 »

实习碰壁之后-正式入坑数据分析

发表于 2019-05-04 | 分类于 method

目前的状态我是一名计算机专业的在读研究生，研究方向是数据可视化，可视分析。从实验室以及研究方向来看，周边大部分同学选择了前端开发，少部分也有做后台的。而我个人并不是特别愿意去做前端开发，我想做数据分析，数据挖掘相关的工作。目前，正是找实习的时候，但是我找数据分析的岗并不顺利，迟迟没有拿到实习of ...

阅读全文 »

易忘易忽略的Python入门知识点

发表于 2019-05-04 | 分类于 technique summary

最近在复习Python的基础知识，发现一些易忽略和忘记的点，这里做一些总结。可改变 VS 不可改变不可改变的数据类型包括：数值、字符串和元组；而可改变的数据类型包括：列表、字典、集合。需要注意字典的key必须为不可变类型；集合虽然是可变的但是它要求包含的元素是不可变类型。不可变类型换一种更官方 ...

阅读全文 »

散列表

发表于 2018-12-18 | 分类于 technique summary

散列表效率之前讲到散列表的查询效率并不能笼统地说成是 O(1) 。它跟散列函数、装载因子、散列冲突都有关系。在极端情况下，恶意攻击者，通过精心构造的数据，使得所有数据经过散列函数后，都散列到同一个槽里。若我们使用的是基于链表的冲突解决办法，那这个时候，散列表就会退化为链表，查询时间度也退化为 ...

阅读全文 »

探索气温趋势

发表于 2018-11-26 | 分类于 project

代码传送门，包括扩展了交互功能的改进版背景分析全球和自己所在地的气温数据，比较所在城市的气温走向与全球气温走向。数据获取从数据库中提取数据。通过Udacity提供的工作区，该工作区与数据库连接。方法一写入以下SQL语句，导出世界气温数据以及最接近自己居住地的大城市气温数据。 ...

阅读全文 »

散列表

发表于 2018-11-18 | 分类于 technique summary

问题 Word有个拼写检查功能，一旦输入的英文单词有错，它就会在单词下方画上红色的波浪线。这个功能是如何实现的？散列表散列表叫Hash Table，即哈希表或者Hash表。散列表用的是数组支持按照下标随机访问数据的特性，所以散列表其实是数组的一种扩展，由数组演化而来。如果没有数组，就没有散列 ...

阅读全文 »

跳表

发表于 2018-11-15 | 分类于 technique summary

二分查找底层依赖的是数组随机访问的特性，所有只能用数组实现。数据存储在链表中，通过改造链表，也可以支持类似二分的查找算法。这种改造之后的数据结构叫作跳表。跳表是一种各方面性能都比较优秀的动态数据结构，可以支持快速的插入、删除、查找操作。可替代红黑树，代码实现比红黑树简单问题为什么 R ...

阅读全文 »

二分查找

发表于 2018-11-10 | 分类于 technique summary

问题通过IP地址可用查找到IP归属地。在百度搜索框里，随便输入一个IP地址，就会看到它的归属地。这个功能是通过维护一个很大的IP地址库来实现的，地址库中包括IP地址范围和归属地的对应关系。问题是，如果有12万条这样的IP区间与归属地的对应关系，如何快速定位出一个IP地址的归属地呢？二分查 ...

阅读全文 »

二分查找

发表于 2018-11-08 | 分类于 technique summary

问题假设有1000万个整数数据，每个数据占8字节，如何设计数据结构和算法，快速判断某个整数是否出现在1000万数据中？（存在多次查找的情况）前提：该功能不要太占用内存空间，最好不超过100MB 二分查找思想栗子生活中的“猜数字大小”游戏，猜的过程中，玩家每猜一次，庄家告诉你是猜大了 ...

阅读全文 »

排序

发表于 2018-11-04 | 分类于 technique summary

主要内容，总结前面的几种算法在各方面的性能。如何选择合适的排序算法？总结前面几种主要排序算法的性能差异。一些算法在一些指标上达到最优情况，还有一些算法的复杂度虽然相同，但在实践中的表现却有差异。最理想的排序算法是 O(n logn) 时间、O(1)空间、稳定、最好还具有适应性。当然目前，还没 ...

阅读全文 »