duangsuse::Echo

31 viewsduangsuse ¯\_(ツ)_/¯ |学渣|母上千古, 18:44

duangsuse::Echo

#Database #Data #Sysadmin #Web #Postgres #SQL #tech Transactions

呃... 其实我也不熟悉你们 DBMS 理论那一套和实践那一套，不过我作为一个普通用户来看，不是特别理解这到底坑不坑（

当然我也不知道为什么一定要 Large Object 资源必须在一个 Transaction 里被释放，他们肯定有他们的一套理由，在搞清楚他们的核心理念之前我觉得我没有资本妄加评论

Large Object 这个大家开发过 DBMS 应用的肯定都知道，就是说一个大对象

Large Objects in PostgreSQL lets you store files/objects up to 4 TiB in size.

The main benefit of using Large Objects instead of a simple column is that the data can be read and written in chunks (e.g. as a stream), instead of having to load the entire column into memory.

它有没有对应的 SQL 去查询我不知道，但就我所知可以用 oid(ObjectID) 查询，我觉得嘛，这个 API 相当有用。因为不用再把数据分为普通数据（DBMS 可存）和文件了。这样的话系统管理、备份、统计、迁移的时候肯定也方便一点，不依赖于文件系统

如果是使用 native （libpq）的程序员我觉得肯定注意得到喽，因为文档上有嘛，至于别的语言做的绑定，封装的如上面所说也都应该有提到，不过教到大家 LO 的确是个不错的实践，或许，虽然这个概念还不如一些平等数据交换、分布式、WebSocket、推送系统火

See also: [PG LO Docs, Node PGLO Binding, Source Header]

GitHub

bleupen/node-pg-large-object

Large object support for PostgreSQL clients using the node-postgres library. - bleupen/node-pg-large-object

51 viewsduangsuse ¯\_(ツ)_/¯ |学渣 ∈ [E²PROM, 含幺半群), edited 07:40

duangsuse::Echo

羽毛的小白板

https://www.zhihu.com/question/313943804/answer/611131982

附注：如果不是服务端应用，或者必须以 JSON 格式传输大量数据，否则我觉得纯 Java 的 JSON 序列化器一般也不会成为性能瓶颈

当然如果是大量数据传输的话，最好还是使用 Protobuf、BSON 这种高效能的序列化方式（CoffeeScript 的 CSON 也可取）

顺便推荐冰封哥的某知乎问题回答... 算了自己翻吧 #JavaScript #Data

40 viewsduangsuse ¯\_(ツ)_/¯ |学渣 | 我爱学习 | ∈ [E²PROM, 范畴论], edited 15:21

duangsuse::Echo

同意（迫真）#Android #NFC #Data

35 viewsduangsuse ¯\_(ツ)_/¯ |学渣 | 我爱学习 | ∈ [E²PROM, 范畴论], edited 15:32

duangsuse::Echo

#CShrap #backend #CLR #data

46 viewsduangsuse ¯\_(ツ)_/¯ |学渣 | 我爱学习 | ∈ [E²PROM, 范畴论], 14:54

duangsuse::Echo

#data #backend #csharp

56 viewsduangsuse ¯\_(ツ)_/¯ |学渣 | 我爱学习 | ∈ [E²PROM, 范畴论], 14:56

duangsuse::Echo

#Python 四舍五入能『优化“矢量化”后的预测结果准确率』一看可能不是正确答案，但是我会用实践测试一下它是不是正确的首先看看这个 wiki 页面，我们提取 HTML 表格数据（下面的编程风格不值得学习，复用性也很差，是我自己瞎堆的，因为我不熟悉 JQuery,,,） let table = $('table.wikitable.sortable') .filter((_, e) => e.firstElementChild.innerText === "费雪鸢尾花卉数据集").get(0);…

#Python #ML #machl #data #JavaScript 想看 Python 机器学习的从这里开始 👆
基本的 Iris 数据集线性回归分类入门

26 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], 14:13

39 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], 02:36

duangsuse::Echo

https://github.com/duangsuse-valid-projects/pr.py #github 一瞬结案如果以后再继续，我肯定会选择支持直接匹配词类队列… 来删除掉不合适的组合和添加合适的词以及提供基于句式学习的方法

直播统计数据(Mean均值、50% 中位的 Rect 和 Pie、总分的 Scatter1D、文/数、文/英的 Scatter2D)。 #Python #data

首先准备混淆处理人名，当然这个混淆不能保证最终的人名包含与原来不一样的字符

hancs = <<EOBJX
赵钱孙李周吴郑王…
EOBJX
hancs = hancs.lines.map(&:strip).join.chars

require 'csv'
scsv = CSV.open('周测8成绩.csv')
scsv.seek(0)
stud = scsv.read()
puts stud[0].join("\t")
stud = [stud[0]]+stud[1..-1].map { |rs| rs.each_with_index.map { |c, i| if i == 0 then (c.chars+hancs.sample(2)).sort.join[1..3] else c.to_i end  } }

然后可以导出给 Python 了……

File.write('stat.csv', stud.map { |row| row.join(",") }.join("\n"))

姓名语文1 语文2 英语1 英语2 英语3 英语4 数学总分周测8名次

from pandas import DataFrame
import pandas as pd
d=pd.read_csv('stat.csv')

因为名次是影响排行的，所以直接整合到表的 order 里即可

d.sort_values('周测8名次', ascending=True)
del d['周测8名次']

首先是平均分的 plot

>>> d.describe()
       语文1        语文2           英语1        英语2       英语3       英语4          数学         总分
count  36.000000  36.000000   36.000000   36.000000   36.000000   36.000000   36.000000   36.000000
mean   46.083333  22.750000   96.888889   93.583333  112.083333  113.250000   86.527778  571.166667
std     2.771024   4.170474    4.055175    6.682066   19.824047    5.405685   12.847426   39.028561
min    35.000000  13.000000   83.000000   71.000000    0.000000   96.000000   47.000000  451.000000
25%    45.000000  19.750000   95.000000   91.250000  112.000000  112.000000   80.500000  557.500000
50%    47.000000  23.000000   98.000000   96.000000  117.000000  115.000000   91.000000  578.500000
75%    47.250000  27.000000  100.000000   98.000000  119.000000  117.000000   97.000000  599.250000
max    50.000000  29.000000  100.000000  105.000000  120.000000  120.000000  100.000000  616.000000
>>> d.head(3)
姓名   语文1  语文2  英语1  英语2  英语3 英语4 数学 总分 
李煜胡   50   28    100   99    120   119  100  616
文王王   49   29    100   98    120   118   98  612
悦祺郑   47   29     99   98    119   119  100  611

……pandas 的人真是连动态规划都不会写，其实也不必要动态规划，
但是 matplotlib 的维护文档感觉很齐全，可配置性也很高，不过我还是通过搜索（而不是通过跟踪 GitHub 上的源代码）找到了设置中文字体的答案……

然后可以打开 IPython 了

import matplotlib as mp
import matplotlib.pyplot as p
mp.rcParams['font.family'] = 'WenQuanYi Zen Hei'

p.plot(d) # 测试一下……
d.plot(title='成绩折线图')

我感觉我的智商受到了侮辱，虽然它本身也没有高到哪里去……
所以要统计好数据必须把很多图做在一个图表里

一种情况是直接画在一个座标系，一种是放子图表……

GitHub

matplotlib/matplotlib

matplotlib: plotting with Python. Contribute to matplotlib/matplotlib development by creating an account on GitHub.

39 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], edited 05:54

duangsuse::Echo

Figure_1注.xcf

200 KB

#GIMP #data #CS #Python 总算收工

32 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], 12:37

duangsuse::Echo

#image #data #school #china #math 🤔 《论语言和数学和对总分的影响》…

41 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], 12:37

30 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], edited 14:24

duangsuse::Echo

https://wechatscope.jmsc.hku.hk/ #WeChat #web #data #statics 这个有意思 🤔

71 viewsduangsuse, 14:43

duangsuse::Echo

guokr #china #statics #data #science

58 viewsduangsuse, 08:34

duangsuse::Echo

#web #js #data #acg 好耶

61 viewsduangsuse, 12:18

duangsuse::Echo

#Gihub #js 🤔 钱钱！ termcolor 钱钱！
https://zhuanlan.zhihu.com/p/378294553 补充： #life 这个可怜的 #web #data #dev 家里失火了，然后他的UI试用假数据生成器被 FAANG 一大堆公司白嫖，还被一个(sponsor) ReTool 白嫖了云服务，可是一分钱也没付给他；而且按MIT协议这样是没错的

我都很好奇这个花了十年的fakedata synth 有多厉害（因为社媒总有夸大的成分），以至于值大价钱，但我不想去，而且有时候就值钱

#life Marak在失火时有些人倾囊相助。相似的，CSS4 https://developer.mozilla.org/zh-CN/docs/Web/CSS/color_value#颜色关键字 RebeccaPurple 是纪念Web布局先锋患癌去世的6岁女儿Rebecca。人情冷暖仍存于技术圈里

知乎专栏

Faker.js作者：要么付钱要么你行你上

去年11月9日，知名开源项目 Faker.js作者「Marak」在其仓库发了一个新issue #1046：（世界五百强公司们）别想再白嫖我的工作成果了，要么给我开一份六位数的合同，要么fork项目自己搞。此 Faker非彼faker。 Fake…

100 viewsduangsuse, edited 14:40

About

Blog

Apps

Platform