![Wassim Seifeddine,法国巴黎的开发者](http://assets.toptal.io/images?url=http%3A%2F%2Fbs-uploads.toptal.io%2Fblackfish-uploads%2Ftalent%2F1163294%2Fpicture%2Foptimized%2Fhuge_7052b17ac6aab878b7911779f8ec2490-7ebdaaca721c06ff2cddf6a42c837be4.jpg&width=524)
Wassim Seifeddine
验证专家 in Engineering
机器学习开发人员
Wassim是一名拥有7年以上经验的软件工程师,其中包括4年以上的机器学习经验. 他与各种各样的客户合作,从初创公司到研究机构再到跨国公司. Wassim从人群中脱颖而出,因为他对构建适应业务需求的可伸缩解决方案了如指掌.
Portfolio
Experience
Availability
首选的环境
PyTorch, PySpark, NumPy, Jupyter笔记本, Pandas, 亚马逊网络服务(AWS), GPT, 生成预训练变压器(GPT), 自然语言处理(NLP), 计算机视觉, Python, 人工智能(AI), GPU Computing
最神奇的...
...我所建立的项目是一个法律案例分类模型, 对案例描述进行分类并突出显示关键文本元素的系统.
工作经验
机器学习工程师
Animaj
- 培养从文本中提取概念的能力, audio, 以及视频内容,以便更好地了解社交媒体趋势. 概念包括情感、活动和对视频中发生的事情的看法.
- 开发了一套Apache气流定向无环图(dag),用于编排数据和机器学习(ML)管道.
- 创建了一个监控系统,可以鸟瞰整个系统,并对超出分布的输入/输出进行异常检测.
- 微调LLMS (gptj, gpt-neox, llama)使用内存和LoRA等省时技术来处理新数据集, DeepSpeed ZeRO, 和PyTorch的FSDP.
- 使用稳定的扩散和其他生成AI模型对自定义数据集进行微调,开发2D/3D图像/视频生成模型.
- 在量化模型方面有丰富的经验(研究和工业),以提高训练和推理的效率.
- 研究了用于分割和目标检测的前沿图像模型.
- 建立一个模型,使用无监督学习将类似的视频聚类在一起,帮助理解视频的趋势.
- 实现了YouTube广告优化模型的最佳位置的中间滚动广告.
机器学习工程师
Mawdoo3 Ltd
- 开发并优化了LLAMA 2模型的微调管道, 增强对各种新领域和新语言的适应能力.
- 监督在GCP Vertex AI上运行的分布式训练管道的开发.
- 实施全面的培训和推理监测系统.
AI/ML Expert
鬼魅熊猫有限公司
- 开发了一个神经网络来模拟游戏中的真实玩家, 作为平衡游戏经济的工具.
- 为客户提供建筑设计建议,并建议后续步骤.
- 创建一个模拟玩家行为的AI模型,以调整和优化游戏的经济系统.
PyTorch部署专家-产品审计
OctoML, Inc.
- 对人工智能平台进行全面审计, 确定性能增强和用户体验改进的关键领域.
- 通过突出显示增强新用户体验的领域,促进用户体验的改进, 影响重新设计,提高用户参与度和满意度.
- 记录所有审计发现和建议, 为平台增强提供清晰和可操作的指南.
NLP Engineer
美纳达科技有限公司
- 作为AI顾问,在自定义数据集上构建个性化GPT模型.
- 帮助优化数据摄取和清理管道.
- 协助开发团队优化他们的开发和实验过程.
NLP / Python开发人员
东北大学工程学院
- 开发一个工具,对产品评论进行基于方面的情感分析.
- 建立了基于方面的评审总结机制.
- 在自定义数据集上微调ML模型以提高性能.
AI/ML Expert
1Bstories
- 开发了一个系统,生成基于多个用户选择的逼真的虚拟人物与TTS模型一起使用.
- 建立了一个场景生成管道,根据特定的描述和偏好生成图像.
- 将MLflow部署到生产环境,以监控所有正在进行的机器学习模型推断.
AI /毫升专家
富柠檬应用程序FZE有限责任公司
- 训练AI模型生成特定风格的用户头像,同时保留面部特征.
- 与之前使用Dreambooth的方法相比,取得了显著的改进, 导致头像与原始面孔非常相似.
- 运用强大的AI/ML知识, Python, LoRA, 扩散模型, 稳定的扩散, 和图像处理来完成项目目标.
机器学习工程师
火星学习公司.
- 帮助调试自定义深度学习模型的评估问题.
- 与一组人工智能研究人员一起调试模型路由器的性能.
- 在GPU集群上运行模型进行训练和评估.
机器学习工程师
Odem全球有限公司
- 微调llm以部署到分散的区块链.
- 开发了一个gRPC服务器,将推理卸载到远程服务器.
- 提高了先进llm的推理速度,以便部署在资源受限的服务器上.
AI Developer
CodeComplete公司
- 从事因果语言模型加速的优化.
- 探索新概念,利用该领域最先进的技术来提高性能.
- 进行深入的分析和实验,以确定潜在的瓶颈,并开发创新的解决方案,以优化语言模型的性能.
- 了解语言建模领域的最新进展,探索其适用性,进一步提高因果语言模型的加速和整体效率.
OCR AI开发人员
ACFT PERFO
- 实现了一个使用AWS extract从PDF文件中提取结构化数据的解决方案.
- 开发端到端管道,用于提取数据并将其保存到数据湖中.
- 提供替代解决方案和工具,以提高数据提取过程的效率和准确性.
资深AI |科技|人力资源顾问
Block Born LLC
- 为AI工具提供建议,根据模式和规模为游戏内容生产提供创造性建议.
- 审查并提供与实施AI工具有关的创意内容建议的反馈.
- 在人工智能及其在创意内容生成中的应用方面表现出深厚的专业知识.
机器学习工程师
广告营销有限责任公司
- 为社交媒体优化产品广告算法.
- 研究改进视频产品植入的技术.
- 探索视频生成建模的深度学习技术.
具有GPT-2/3技能的机器学习工程师
Toptal
- 训练了一个gpt风格的模型,用于部署在位张量网络上的简单语言建模.
- 配置一个迭代过程,从以前的检查点在新数据集上训练模型.
- 在培训期间和培训后监控模型的性能,以了解何时需要重新培训.
首席机器学习工程师
量子分析”
- 曾在一家房地产初创公司担任创业顾问,帮助他们更好地了解数据基础设施,并指导他们使用ETL管道使用正确的工具, data lakes, delta tables, 热存储.
- 开发了一套完整的PySpark etl用于转换, cleaning, 对来自不同数据源和行业的数据进行规范化, 包括房地产和农业.
- 使用来自不同提供商的客户级数据和奖励数据,为一家早期初创公司构建了一个个性化的基于机器学习的员工奖励模型,作为MVP.
- 管理技术团队,包括为整个团队设计架构. 架构范围从带有动态代理的web抓取器到热存储数据, 准备好被REST api使用.
- 为零售领域的消费者需求预测者开发机器学习模型,专注于优化分销以避免缺货.
- 研究一种算法,用于预测消费者对特定产品的需求,以帮助我们的客户战略性地进入新市场.
- 为房地产电子商务网站开发价格异常检测系统,通知用户潜在的好交易.
博士研究
南特大学
- 完成我的博士论文:用计算机算法加速神经网络.
- 设计新的神经网络训练策略,鼓励低精度的神经网络有更好的表现.
- 为低级操作和功能近似开发自定义CUDA操作.
- 开发了RL算法,用于解决大型分类观测空间中的优化问题.
- 参加与机器学习和计算机算术相关的会议和研究学校.
Researcher
Inria
- 参与一个研究项目,使用早期退出网络在小型资源受限设备上运行大型机器学习模型.
- 与两位教授合作,对模型压缩技术进行文献综述, 包括量子化, pruning, 知识的提炼.
- 实现了一个强化学习解决方案(DQN)来解决一个优化问题.
- 在一个国际会议上发表论文,并在会上介绍工作成果.
机器学习工程师
Navya
- 使目标检测模型更快,更轻,能够在伪实时运行中部署在自动驾驶汽车上.
- 与核心机器学习团队密切合作,以确保我们在实验设置和结果上保持一致.
- 尝试了多种模型压缩策略,如修剪, quantization, 并编制评价各方法的有效性.
- 将模型压缩约4倍,推理速度提高3倍,同时保持与原始模型相同的性能.
Data Scientist
SannSyn
- 开发了一个系统,可以根据行业专家输入的原始文本对法律案件进行分类. 给出的数据是从在线资源中提取的原始数据和OCR pdf.
- 对非结构化数据进行数据分析,以了解如何处理数据以及提高质量所需的流程.
- 建了一个刮网器来刮财经新闻.
- 使用基于转换器的模型为财经新闻文章提供情感分析功能.
机器学习工程师
Tedmob
- 使用RASA AI开发面向客户的聊天机器人, Dialogflow, 以及Microsoft bot框架,用于一家领先的电信运营商,用于处理常见问题和与OTP身份验证和第三方集成相关的帐户问题.
- 使用各种工具实时跟踪问题,如Sentry、ELK stack和Docker监控工具.
- 处理与客户的会议,并收集各种团队需求,以达到最佳的发布过程.
iOS部门负责人
Tedmob
- 领导和监督iOS开发团队两年.
- 管理新员工的招聘和入职流程.
- 迁移团队技术栈并合并新的软件架构.
iOS Developer
Tedmob
- 为从个人创业公司到跨国公司的客户开发商业应用程序.
- 实时跟踪应用程序端发生的问题,并在下一个版本中解决它们.
- 将旧的应用程序从Objective-C迁移到Swift.
Experience
从视频中提取概念
这些概念包括:
• Emotions
• Activities
• Sentiment
• Objects
• Movement
目标检测的量化神经网络
使用的模型是ImageNet上带有SSDLite对象检测器的MobileNetV2预训练模型. 我们以FP32数据格式训练模型.
我应用了几种模型压缩技术来减小模型的大小并监控其性能.
我们使用的一些方法是:
• Quantization
• Pruning
•融合卷积
•知识蒸馏
这项工作的结论是,该模型可以可靠地检测图像中的物体,其精度与FP32版本相同,同时可以低至INT8数据格式.
随意语言模型微调
法律案件分类
•对非结构化的凌乱文本数据进行EDA,以了解如何处理这些数据
•建立一个模型,根据输入的描述将法律案件分为几个类别. 这一部分的目的是提供一个工具,帮助律师更快更容易地分类案件.
•从案例描述中提取与分类相关的实体,以帮助反驳.
自定义语言模型培训框架
http://github.com/pegesund/nor_bert多模态文本分类器
推特情绪分析
在边缘设备上运行神经网络
http://ieeexplore.ieee.org/abstract/document/9664700挪威情绪分析模型
• Positive
• Neutral
• Negative.
主要的困难是找到一个好的挪威语标记情感分析数据集,并对现有的多语言模型进行微调.
Education
计算机科学博士学位
南特大学-南特,法国
人工智能硕士学位
ESIEE巴黎-巴黎,法国
计算机科学学士学位
黎巴嫩大学-贝鲁特,黎巴嫩
认证
深度学习专业化
DeepLearning.来自Coursera
高级机器学习专业化
DeepLearning.人工智能和斯坦福在线|通过Coursera
机器学习
斯坦福大学|来源:Coursera
iOS开发者
Udacity
Skills
Libraries/APIs
PyTorch, NumPy, Pandas, Matplotlib, XGBoost, PySpark, TensorFlow, OpenCV, REST APIs, Scikit-learn, YouTube API, cuBLAS
Tools
Apache气流, Amazon EKS, Google Bard, Xcode, Jira, Jupyter, AWS ELB, Amazon弹性容器服务(Amazon ECS), AWS Fargate, ChatGPT, 亚马逊Textract, 亚马逊SageMaker, Apache的冰山
Languages
Python, Python 3, Bash, SQL, Snowflake, c++, Swift, JavaScript
Platforms
Jupyter笔记本, Docker, Databricks, 亚马逊网络服务(AWS), Embedded Linux, iOS, AWS Lambda, NVIDIA CUDA, Blockchain, Microsoft Edge, 谷歌云平台(GCP)
Paradigms
数据科学,移动开发,ETL,应用程序开发,分布式计算,实时系统
Storage
NoSQL, MySQL, 亚马逊DynamoDB,数据湖,Amazon S3 (AWS S3)
Frameworks
Apache Spark, Spark, Flask, gRPC
行业专业知识
项目管理
Other
机器学习, 计算机视觉, 情绪分析, Deep Learning, 自然语言处理(NLP), 人工智能(AI), 图像处理, OCR, 计算机视觉算法, 移动应用开发, 预测建模, Algorithms, APIs, 数据分析, 数据可视化, Forecasting, AI Design, 工程数据, 深度神经网络, Data Analysis, CTO, 预测分析, Statistics, Datasets, 因果推论, Fine-tuning, 数据推理, Programming, Architecture, Analytics, 图像识别, API集成, GPT, 生成预训练变压器(GPT), 软件架构, 图形处理器(GPU), 卷积神经网络(CNN), 图像分析, GPU Computing, 云架构, Models, 监督式学习, Optimization, Consulting, Advisory, 技术咨询, 创业咨询, 面部识别, OpenAI, GPT Neo, Google Publisher Tag (GPT), DeepSpeed, 文本生成, 语音识别, Web开发, 手写识别, 大型语言模型(llm), 数据管理, 稳定的扩散, ControlNet, 机器学习操作(MLOps), 数据驱动营销, 生成预训练变压器3 (GPT-3), OpenAI GPT-4 API, Research, 异常值检测, 无监督学习, 提示工程, 检索增强生成(RAG), Graph Theory, Arithmetic, 对象检测, 神经网络, Slurm工作量管理器, Chatbots, 推荐系统, Quantization, Data Scraping, Clustering, 文本分类, 物联网(IoT), 语言模型, 数据仓库, 趋势预测, 主题建模, 收入预测, 视频分析, 语音合成, Sound, Text Animation, 扩散模型, 图像生成, 定量金融学, 对象跟踪, 生成模型, Plugins, GPT-4, OpenAI GPT-3 API, YouTube Ads, Videos, LoRa, Flash的关注, Pricing Models, DreamBooth, Kohya, Wearables, Biometrics, 强化学习, Text to Image, Text to Video, MLflow, Midjourney, Avatars, DQN, Modeling, LLaMA, MosaicML, 深度强化学习, AI Programming, 游戏开发, Mobile Games, Data, 生成式人工智能(GenAI), Generative AI, Llama 2, Lottie, AI-generated视频
如何使用Toptal
在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.
分享你的需求
选择你的才能
开始你的无风险人才试验
对顶尖人才的需求很大.
Start hiring